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OM nucleic - nucleic search, using sw model 
Run on : 



Title: 

Perfect score: 
Sequence : 



March 25, 2004, 23:39:01 ; Search time 8388.21 Seconds 

(without alignments) 
11011.138 Million cell updates/sec 

US-09-856-681A-1 
3093 

1 atgaggtcagaagccttgct ccaatgatgcgtgtacataa 3093 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 27513289 seqs, 14931090276 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 
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em_estba : * 
em^esthum: * 
em_estin: * 
em_estmu: * 
em_es tov: * 
em_estpl : * 
em_estro : * 
em_htc : * 
gb_estl : * 
gb_est2:* 
gb_htc : * 
gb_est3 : * 
gb_est4 : * 
gb_est5 : * 
em_estf un : * 
em_es torn: * 
em_gss_hum: * 
em gss__inv:* 
em gss_pln:* 
em__gss_vrt : * 
em_gss_f un: * 
em_gs s_mam : * 
em_gss_mus : * 
em_gss_pro: * 
em_gss_rod: * 
em_gss_ phg : * 
em_gss_vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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BC032619 6875 bp mRNA linear HTC 04-MAR-2003 

Homo sapiens, similar to sema domain, transmembrane domain (TM) , 
and cytoplasmic domain, (semaphorin) 6A, clone IMAGE : 5578066, mRNA. 
BC032619 

BC032619. 1 GI : 2274 9800 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 6875) 
Strausberg, R. 
Direct Submission 

Submitted { 06- JUN-2 002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, ME> 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 
Contact: MGC help desk 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: ATCC/DCTD/DTP 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 

Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter,N., Ayele,K., Beckstrom-Sternberg, S . M. , Benjamin, B., 
Blakesley, R.W. , Bouf f ard, G. G. , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N. L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro, Q. L. , Masiello, C. , Maskeri, B. , Mastrian, S . D. ,McCloskey, J. C . , 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas, P. J., Touchman, J . W . , 
Tsurgeon,C, Vogt,J.L., Walker, M. A. , Wetherby, K. D . , Wiggins, L., 
Young, A. , Zhang, L.-H. and Green, E.D. 



Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 69 Row: o Column: 4 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 11991659 
This clone has the following problem: retained intron. 
FEATURES Location/Qualifiers 
source 1. .6875 

/organism-"Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 5578066" 

/tissue type="Skin, melanotic melanoma." 



/ cl on e_l ib= " N I H_MGC_7 2 " 
/lab_host="DH10B" 
/note="Vector: pCMV-SPORT6" 

ORIGIN 

Query Match 99.9%; Score 3089.8; DB 11; Length 6875; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 3091; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I i I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 92 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 851 

Qy 61 CCAGAAGATTCT GAGCCAAT CAGTAT TTCGCATGGCAACTATACAAAACAGTAT CCGGT G 12 0 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 852 C CAGAAG ATT C T GAG CCAAT C AGT AT T T C GC AT GGCAACT AT ACAAAACAGT AT C C G GT G 911 

Qy 121 TTTGT GGGCCACAAGCCAGGACGGAACAC CACACAGAGGCACAGGCT GGACATCCAGAT G 180 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 912 T T T GT GGGCCACAAGCCAGGAC GGAACAC CACACAGAGGCACAGGCT GGAC AT CCAGAT G 971 

Qy 181 AT TAT GAT CAT GAAC GGAAC C CT CT AC AT T GCTGCT AGG GAC CAT AT T TAT ACT GT T GAT 240 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 972 AT TAT GAT CAT GAAC GGAAC C CT CT AC AT T GCT GCT AG GGAC CAT ATT TAT ACT GTT GAT 1031 

Qy 241 AT AGACACAT C AC ACAC GGAAGAAAT T T ATT GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1032 AT AGACACAT CAC ACAC GGAAGAAAT TT ATT GT AGCAAAAAACT GACAT GGAAAT CT AGA 1091 

Qy 301 CAGGC C GAT GT AGACACATGC AGAAT GAAGGGAAAAC AT AAG GAT GAGT GC CACAACTT T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I II I I I 
Db 1092 CAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAAC AT AAGGAT GAGT G C CACAACT T T 1151 

Qy 361 ATT AAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GTT T GT CTGT GGAACT AAT G CCT T C 42 0 

I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1152 ATTAAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACT AAT GCCT T C 1211 

Qy 421 AAC C CT T C CT GCAGAAAC T AT AAGAT GGAT ACAT T GGAAC CATT C GGGGAT GAAT T CAGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I 

Db 1212 AAC C CT T C CT GCAGAAACT AT AAGAT GGAT ACAT T GGAAC CATT C GG GGAT GAAT TC AGC 1271 

Qy 4 81 GGAAT GGC CAGAT GCC CATAT GAT GCCAAACAT G C CAACGT T GCACT GT T T GCAGAT GGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1272 G GAAT GG C CAGAT GCC CATAT GAT GCCAAACAT GC CAACGT T GCACT GTT T G CAGAT G GA 1331 

Qy 541 AAACT AT ACT CAGC CACAGT GACT GACT TC CT T GC CAT T GAC GCAGT C AT TT AC C GGAGT 600 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1332 AAACTAT AC T CAGC CAC AGT GACT GACT T C C T T G C CAT T GAC G CAGT CAT T T AC C GGAGT 1391 

Qy 601 CTT GGAGAAAGCCCTACC CT GCGGACCGTCAAGCACGATT CAAAATGGTT GAAAGAACCA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1392 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 1451 



Qy 

Db 



661 
1452 



720 
1511 



721 GT GGAGTAT AAC AC CAT GG GAAAGGT AGTTT T C C C AAGAGT G G CT CAGGT TT GT AAGAAT 78 0 
I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 
1512 GT GGAGTAT AAC AC CAT GGGAAAGGT AGT T T T C C CAAGAGT GGCT CAGGT T T GT AAGAAT 1571 

7 81 GAT AT G GGAGGAT C TCAAAGAGT C CT GGAGAAACAGT GGAC GT C GT T CCT GAAGGC GC GC 84 0 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1572 GAT AT G GGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT C GT T C CT GAAGGC GC GC 1631 

841 TT GAACT GCT CAGT T C CT GGAGACTCT CAT T TT T AT T T CAAC AT T CT CCAGGC AGT TACA 900 
I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1632 TT GAACT GCT CAGT TC CT GGAGACT CT CAT T TT T AT T T CAAC AT T CT CCAGGC AGT TACA 1691 

901 GAT GT GATT C GT AT CAACGGGC GT GAT GT T GT C CT GGCAAC GT T TT CT AC AC CT TAT AAC 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1692 GAT GT GATT C GT AT CAACGGGC GT GAT GT T GT CCT GG CAAC GT T TT CT ACAC CT T AT AAC 17 51 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
1752 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1811 

1021 GGGAGAT T CAAGGAAC AGAAGT C T C CT GATT C CACCT GGAC AC CAGT TC CT GAT GAACGA 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1812 GGGAGAT T CAAG GAAC AGAAGT CT C CT GAT T C C AC CT GGACAC CAGT T C CT GAT GAACGA 1871 

1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I M I II I 

1872 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1931 

1141 T CCAAT GAGTTC CCT GAT GATACCCT GAACTT CAT CAAGACGCACCCGCT CAT GGAT GAG 12 00 

I | | | | || | | | | II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1932 T C CAAT GAGT T C C CT GAT GAT AC CCT GAACTT CAT CAAGACGCAC C C GCT CAT GGAT GAG 1991 

1201 G C AGT GC C CT C C ATCTT CAACAGGC CAT GGTT C CT GAGAACAAT G GT CAGAT ACC GC CT T 12 60 

I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1992 GCAGT GCCCT C CAT CTT CAACAGGC CAT GGTT CCT GAGAACAAT GGT CAGATACCGCCTT 2051 

1261 AC CAAAAT T GCAGT GGAC ACAGC T GCT GG GC CAT AT CAGAAT CAC ACT GT GGTTT T T CT G 1320 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
2052 ACCAAAATT GCAGT GGACACAGCT GCT GGGC CAT AT CAGAAT CAC ACT GT GGTTTTT CT G 2111 

1321 GGAT CAGAGAAGGGAAT C AT CT T GAAGT T TT T G GC CAGAAT AGGAAAT AGT GGTT T T CT A 1380 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2112 G GAT C AGAGAAG GGAAT CAT CTT GAAGT T T T T GGC CAGAAT AGGAAAT AGT G GTT T T CT A 2171 

1381 AAT GACAGC CT T T T C CT GGAG GAGAT GAGT GT TT ACAACT CT GAAAAAT GC AGCT ATGAT 1440 

I I I || I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2172 AAT GACAGC CT T T T C CT GGAGGAGAT GAGT GTT T ACAACT CT GAAAAAT GCAG CT AT GAT 2231 

1441 GGAGT CGAAGACAAAAGGATCAT GGGCATGCAGCT GGACAGAGCAAGCAGCT CTCTGTAT 1500 
I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2232 G GAGT CGAAGACAAAAG GAT CAT GGGCAT GCAG CT GGACAGAGCAAGCAGCT CT CT GT AT 22 91 

1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I M I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I 

2292 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 2351 

1561 T GTAAAAAAACCTGTATT GCCT CCAGAGACCCATATTGT GGATGGATAAAGGAAGGTGGT 1620 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 

Db 2352 T GT AAAAAAACCT GT AT T GC CT C C AGAGACC CAT AT T GT GGAT GGAT AAAG GAAG GT GGT 2411 

Qy 1621 GC CT G CAGC CAT T TAT CAC C CAAC AGC AGACT GACT T TT GAGCAGGACAT AGAGC GT GGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2412 GC CT G CAGC CAT T TAT CAC C CAAC AGC AGACT GACT T TT GAGCAGGACAT AGAGC GT GGC 24 71 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2472 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 2531 

Qy 1741 T C CCT CTT GC CC AGC ACAAC C ACAT CAGATT C GAC GGCT CAAGAGG GGT AT GAGT CT AGG 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2532 T C CCT CTT GC CC AGC ACAAC C ACAT CAGATT C GAC GGCT CAAGAGGGGT AT GAGT CT AGG 2591 

Qy 1801 GGAGGAATGCTG GAC TGGAAGCATCTGCTT GACT CAC CTGACAGCACAGACC CTT TGGGG 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2592 GGAGGAATGCTG GACT GGAAGCATCTGCTT GACT CAC CTGACAGCACAGACC CTT TGGGG 2 651 

Qy 1861 G CAGT GT CT T C C C ATAAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGT T AC CT CAAA 1920 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2652 G CAGT GT C T T C C C ATAAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGT T AC CT CAAA 2711 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2712 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2771 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
Db 2772 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 28 31 

Qy 2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2 832 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2 8 91 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 8 92 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2951 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I 

Db 2952 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 3011 

Qy 2221 AT GCT CAT TAAAGCAGACC AGCAC CAC C T GGAC CT GAC GGCCCTCCC CAC C C CAGAGT C A 2280 

I II I II I I I I I I I I I I I I I II I I M I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3012 AT GCT CATTAAAGCAGACC AGCAC C AC CT GGAC CT GAC GGCC CT CC C CAC C C CAGAGT C A 3071 

Qy 22 81 ACC C CAAC GCT G C AG CAGAAG CGGAAGC C CAGC C GC GGC AGC C G CGAGT GGGAGAG GAAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 

Db 3072 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 3131 

Qy 2341 CAGAACCT CAT CAAT GC CT GCACAAAGGAC AT G C C C CC CAT GGGCTCCCCTGT GAT T C C C 24 00 

I I II M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3132 CAGAAC CT CAT CAAT GC CT G CAC AAAGGAC AT GC C C CC C AT GGG CT C C CCT GT GAT T C C C 3191 



Qy 



24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 
II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I II I II I I I I I I 



Db 



3192 



ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 3251 



Qy 2 461 AC GCAGCAGG GCTAC C AGC AT GAGT AC GT G GAC CAGC CCAAAAT GAGCGAGGT GGC C CAG 2520 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3252 AC GCAGCAGG G CT AC CAG CAT GAGTAC GT G GAC CAGC CCAAAAT GAG CGAGGT GGC C CAG 3311 

Qy 2521 AT GGC GCT GGAGGACCAGGCCGC CACACT GGAGTATAAGACCAT CAAGGAACAT CT CAGC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3312 AT GGCGCTGGAGGACCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACAT CT CAGC 3371 

Qy 2581 AG CAAGAGT C C CAAC C AT GGGGT GAAC CT T GT G GAGAAC CT G GACAGCCT GC C C C C CAAA 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3372 AG CAAGAGT C C CAAC CAT GGGGT GAAC CT T GT G GAGAAC CTG GAC AGCCT GC C C C C CAAA 3431 

Qy 2 641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I i I I I I I I I I I I I M I I I I I II I I I I I I I 
Db 3432 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 34 91 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 92 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 3551 

Qy 2761 CCCAC GAACT CGCTCACGAGAAGCCAC CAGGCCACCACT CTCAAAAGAAACAACACTAAC 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3552 CC CAC GAACT CGCT CACGAGAAGCCAC CAGGCCACCACT CTCAAAAGAAACAACACTAAC 3611 

Qy 2 821 TCCTCCAATTCCTCTCACCTCTCCAG7WVCCAGAGCTTTGGCAGGGGAGACAACCCGCCG 28 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I 
Db 3612 T C CT C CAAT T CCT CT CACCT CT C CAGAAAC CAGAGC TTT GGCAG GGGAGACAAC CC GCC G 3671 

Qy 2 881 C C C GC C C CGCAGAGG GT GGACT C CAT C CAG GT GCAC AGCT CC CAGC CAT CT GG C CAGGC C 2940 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3672 CCCGCCCCGCAGAGGGTGGACTCCATCCCGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 3731 

Qy 2 941 GTGACTGTCTCGAGGCAGCC CAGC CT CAAC GCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

I I I I I I I I I II I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3732 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3791 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 3792 TAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3851 

Qy 3061 AC AT C CAT GAAGC C CAAT GAT GC GT GT AC ATAA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3852 AC AT C CAT GAAGC C CAAT GAT GC GT GT AC ATAA 38 8 4 
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AK042751 3226 bp mRNA linear HTC 19-SEP-2003 

Mus musculus 7 days neonate cerebellum cDNA, RIKEN full-length 
enriched library, clone :A730020P05 product : sema domain, 
transmembrane domain (TM) , and cytoplasmic domain, (semaphorin) 6A, 
full insert sequence. 
AK042751 

AK042751. 1 GI: 26335300 
HTC; CAP trapper. 
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FEATURES Location/Qualifiers 
source 1. .3226 

/organism="Mus musculus" 

/mol_type="mRNA M 

/strain="C57BL/6J" 

/db_xref= ,f FANTOM_DB:A730020P05" 

/ db_x r e f = "MGI :2407849" 

/db_xref="taxon: 10090" 

/clone- "A730020P05" 

/tissue_type=" cerebellum" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="7 days neonate" 
CDS 671. .2488 

/note="unnamed protein product; putative 

sema domain, transmembrane domain (TM) , and cytoplasmic 

domain, (semaphorin) 6A (MGD | MGI : 1203727 , GB | NM_018744 , 

evidence: BLASTN, 100%, match=1802 ) " 

/ codon__start-l 

/protein_id="BAC31351 . 1" 

/db_xref="GI: 26335301" 

/ translation="MRPAALLLCLTLLHCAGAGFPEDSEPISISHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNRTLYVAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDTLFVCGTNAFNPSCRNYRVDTLETFGDEFS 
GMARCPYDAKHANIALFADGKLYSATVTDFLAI DAVIYRSLGDSPTLRTVKHDSKWLK 
EPYFVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSF 
LKARLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDMLD 
IANVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLEKYATSNEFPDDTLNFI 
KTHPLMDEAVPSIINRPWFLRTMVRYRLTKIAVDNAAGPYQNHTWFLGSEKGIILKF 
LARIGSSGFLNGSLFLEEMNVYNPEKCSYDGVEDKRIMGMQLDRASGSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWVRESGSCAHLSPLSRLTFEQDIERGNTDGLG 
DCHNSFVALNDISTPLPDYEMSFNRVYGQFIAIYIYINT" 

ORIGIN 



Query Match 46.5%; Score 1439.4; DB 11; Length 3226; 

Best Local Similarity 89.1%; Pred. No. 0; 

Matches 1554; Conservative 0; Mismatches 191; Indels 0; Gaps 0; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 671 ATGCGGCCAGCAGCCTTACTGCTGTGTCTCACACTGCTACACTGCGCTGGGGCTGGTTTC 730 



61 C CAGAAGAT T CT GAG C CAAT C AGT AT TT C GCAT G G CAACTATACAAAACAGT AT C C GGT G 120 
I I I I I I I I I I I I I I I I I I II I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 7 31 CCAGAAGATT CCGAGC CAAT CAGTATTT CGCATGGCAACTATACAAAACAGTAT CCGGTG 79 0 

Qy 121 T T T GT G GGC C ACAAGC C AGGACGGAACAC CACAC AGAGGC ACAGGCTG GACAT C CAGAT G : ' 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 791 T T T GT GGGC C ACAAGC CAGGACG GAACAC CACGC AGAGGCACAGGC T GGACAT C CAGAT G 850 

Qy 181 ATTATGATCAT GAACGGAAC CCT CTACATT GCT GCTAGGGACCATATTTATACT GTT GAT 24 0 

II I I I II I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 851 AT CAT GAT CAT GAACAGAAC C CT CT AC GTTGCTGCTC GAGACC AT AT T TAT ACT GTT GAT 910 

Qy 241 ATAGAC ACAT CACACAC GGAAGAAATT TAT T GT AGCAAAAAACT GACAT GGAAAT C T AGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 911 AT AGAC ACAT C CC ACAC AGAAGAAAT T TACT GT AGCAAAAAACT GACAT GGAAAT CT AGA 970 

Qy 301 CAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT G C CACAACT TT 360 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 II I I I I I I I I 
Db 971 CAGGCT GAC GT AGACACAT GCAG GAT GAAG GGGAAAC AT AAGGAT GAAT GT CACAACT T C 1030 

Qy 361 ATT AAAGT TCT T CT AAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACT AAT GCCT T C 420 

I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1031 ATT AAAGT T CT T C T CAAGAAGAAT GAT GAT AC GCTGTTTGTCT GT GGAAC CAAT G CCT T C 1090 

Qy 421 AAC C C T T C CT G C AGAAAC TAT AAGAT GGAT ACAT T GGAAC C ATT C GGG GAT GAATT CAGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 
Db 1091 AAC C CT T C CT GC AGAAAC TACAGGGT C GAT AC CT T GGAAACT TT T GG GGAT GAAT TT AGC 1150 

Qy 4 81 GGAAT G GC CAGAT GC C CAT AT GAT G CCAAACAT G C CAACGT T GCACT GT T T GCAGAT GGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1151 G GAAT GGC CAGAT G C C CT TAT GAT GCCAAAC AT G G CAACAT C GCT CT GT T T GCAGAT GGA 1210 

Qy 541 AAACT AT ACT C AG C CAC AGT GACT GACT T C CT T GC CAT T GAC G CAGT CAT T T AC C GGAGT 600 

I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 

Db 1211 AAACT CT ACT C GGCTAC AGT GACT GACT TT CT GGC CAT T GAT GC AGT CAT T T AC AGGAGC 12 7 0 

Qy 601 CTT GGAGAAAG C C CTAC C CT GC GGACC GT CAAGC ACGAT T CAAAAT GGT T GAAAGAACCA 660 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 1271 CT CGGAGACAG C C CT AC C CT C AGGACT GTCAAGC AT GAT T CAAAGTGGT T GAAAGAGC C G 1330 

Qy 661 TACT T T GT T CAAGC C GT GGAT T AC G GAGAT T AT AT CT ACTT CTT CT T C AGGGAAAT AGCA 720 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I Mill Ml 

Db 1331 T ACT T T GT CCAAG C C GT GGAT TAT GGGGACT AT AT CT ACTT CTT CT T C AGAGAAATT GCA 1390 

Qy 721 GTGGAGTATAACACCATGGGAAAGGTAGTTTT CC CAAGAGT GGCT CAGGTTT GTAAGAAT 7 80 

II II II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1391 GTAGAATACAACACTATGGGGAAGGTTGTTTTCCCTAGGGT GGCT CAGGTCT GTAAGAAT 1450 

Qy 781 GAT AT GGGAGGAT CT CAAAGAGT C CT G GAGAAAC AGT GGAC GT C GT T C C T GAAGG CGC G C 84 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 
Db 1451 GACAT GG GAGGGT C T CAGAGAGT C CT GGAGAAGC AGT GGACATC TT T CCT GAAGGCT CGC 1510 

Qy 841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I II I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1511 CT GAACT GCTCGGTGCCT GGAGACT CT CAT T T TT AT T T CAAT AT AC T C CAGGCAGTT ACA 1570 

Qy 901 GAT GT GAT TC GT AT CAAC GGGC GT GAT GT T GT CCT GGCAAC GTT TT CTAC AC CT TAT AAC 960 

I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 1571 GAT GT GAT TC G C ATTAAT GGC C GT GAT GTT GT CT T GGCAAC CTT T T C CACAC CT TAT AAC 1630 



Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 102 0 

1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r i Mini II I 

Db 1631 AG CAT C CC AGGT T CT GCAGT CT GT GC C TAT GACAT GCT T GAC ATT GC TAAT GT TT T CACT 1690 

Qy 1021 G GGAGATT CAAG GAACAGAAGT CT C CT GAT TC CAC CT GGAC AC CAGT T C CT GAT GAAC GA 1080 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I II I I I I I I II I I I I I I 
Db 1691 G GGAGGTT CAAGGAACAGAAAT CAC CT GACT C TAC CT GGAC AC CC GT T C CAGACGAAC GA 1750 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1751 GTCCCTAAGCCCAGGCCAGGCTGTTGTGCTGGATCATCCTCTTTAGAAAAATATGCAACC 1810 

Qy 1141 T C C AAT GAGT T C C CT GAT GAT AC C CT GAACTT CAT CAAGACGC AC C C GCT CAT GGAT GAG 1200 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I M I I I I I II I I I I I II I III 
Db 1811 TCCAAT GAGTTT CCCGATGATACCCT GAACTTCATTAAGACGCATCCACT CAT GGAC GAG 187 0 

Qy 1201 GCAGT GCC CT C CAT C T T CAACAGGC CAT GGTT C CT GAGAACAAT GGT CAGAT AC C GC CT T 1260 

I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1871 GCAGT GCCT T C CATC AT CAACAGAC CTT GGTT C CT GAGAACAAT G GT CAGAT AC C GC CT G 1930 

Qy 1261 AC CAAAAT T GCAGTGGACACAGC T GCT GG GCCATAT CAGAAT C ACACT GT GGT T TTT CT G 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 1931 AC CAAAAT T GCAGT AGACAACGCT GC C GG G CCAT AT CAGAAT CACACT GT GGT TTT C CT G 1990 

Qy 1321 GGATCAGAGAAGGGAAT CAT CTT GAAGTTTTT GGCCAGAATAGGAAATAGT GGTTTTCTA 138 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I II I I I I I I I I I I I I I I I III 
Db 1991 GGATCAGAAAAGGGAAT CAT CCT GAAGTT CTT GGCCAGGATAGGAAGCAGT GGTTT CCTA 2050 

Qy 1381 AAT GACAGC CTT TT C CT GGAGGAGAT GAGT GT T T ACAAC T CT GAAAAAT GCAG CTAT GAT 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2 051 AAT GGCAGCCTTTT CCT GGAGGAGAT GAAT GTTTACAACCCAGAAAAGTGCAGCTAT GAT 2110 

Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCTGGACAGAGCAAGCAGCT CTCTGTAT 1500 

II II I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I I I I I II I I I I II III 

Db 2111 GGT GT AGAAGACAAAAGGAT CAT GGG CAT GCAGCT C GAC AGAGC GAGT GGCT CACT CTAT 217 0 

Qy 1501 GTT GC GT T CT CT AC CT GT GT GAT AAAG GT T CC C CTT GGC C GGT GT GAAC GACAT GGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2171 GT T GC AT T CT CT AC TT GT GT GAT CAAGGT GCCTCTTGGCCGCTGT GAGC GACAT GGGAAG 2230 

Qy 1561 T GTAAAAAAACCT GT AT T GC CT C C AGAGAC CCATAT T GT G GAT GGAT AAAGGAAGGT GGT 162 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I I 
Db 2231 TGTAAAAAAACCTGCATCGCCTCCAGAGACCCGTATTGTGGGTGGGTAAGGGAAAGTGGT 22 90 

Qy 1621 GC C TGCAGC CAT TT AT CAC C CAACAGCAGAC T GACT T TT GAGC AGGACAT AGAGC GT GGC 168 0 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2291 T C C T GT GCC CAT CT GT CAC C C CT TAG CAGACT GAC AT TT GAGC AGGACATT GAG CGT GGC 2350 

Qy 1681 AAT ACAGAT GGT CT G GG GGACT GT CACAAT T C CT TT GTG GCACT GAAT GGG CAT T C CAGT 174 0 

I I I I I II II II II I I I I I I I M I I I I I I I I I I I I I I II I I I I I III I I 

Db 2351 AAT AC GGAC GGC CT AGGAGACT GT CACAAT T C CT TC GT GGCACT GAAT GACAT T T CAACT 2410 

1745 

2415 



Qy 1741 TCCCT 

I I I 

Db 2 411 CCTCT 



RESULT 3 
AK082711 
■ LOCUS 
DEFINITION 



ACCESSION 
■VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



AK082711 3329 bp mRNA linear HTC 20-SEP-2003 

Mus musculus 0 day neonate cerebellum cDNA, RIKEN full-length 
enriched library, clone : C230094A19 product : sema domain, 
transmembrane domain (TM) , and cytoplasmic domain, (semaphorin) 6A, 
full insert sequence. 
AK082711 

AK082711. 1 GI: 2634 9884 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki , Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K 



Itoh,M., Aizawa,K., 
Konno,H., Akiyama,J., Nishi,K., 
Sumi,N., Ishii,Y., Nakamura,S., 



Nagaoka,S., Sasaki, N., Carninci,P., 
Kitsunai,T., Tashiro,H., Itoh,M., 
Hazama,M., Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi , S . , Ikegami,T., Kashiwagi , K . , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3329) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A. , Hashizume,W. , 
Hayashida,K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 



Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa, T . , 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki, A. , Murata,M., 
Nakamura,M., Nishi,K., Nomura, K. f Numazaki,R., Ohno,M. , Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume, N . , 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-APR-2002 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken. go . jp, 
URL :http: //genome . gsc. riken . go . jp/ , Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL:http: //genome . gsc . riken. go. jp/ 
URL : http : // fan torn. gsc . riken. go . jp/ . 
FEATURES Location/Qualifiers 
source 1. .3329 

/organism-"Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/ db_xref =" FANTOM_DB : C230094A19" 

/db_xref="MGI: 2416235" 

/db_xref="taxon: 10090" 

/clone="C2 30094A19" 

/ tissue_type="cerebellum" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="0 day neonate" 
CDS 673. .2436 

/note="unnamed protein product; putative 

sema domain, transmembrane domain (TM) , and cytoplasmic 

domain, (semaphorin) 6A (MGD | MGI : 1203727 , GB | NM_0 18744, 

evidence: BLASTN, 100%, match=1802 ) " 

/codon_start=l 

/protein_id="BAC38582 . 1" 

/db_xref="GI: 26349885" 

/ translation="MRPAALLLCLTLLHCAGAGFPEDSEPISISHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNRTLYVAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDTLFVCGTNAFNPSCRNYRVDTLETFGDEFS 
GMARCPYDAKHANIALFADGKLYSATVTDFLAI DAVI YRSLGDSPTLRTVKHDSKWLK 
EPYFVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSF 
LKARLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDMLD 
IANVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLEKYATSNEFPDDTLNFI 
KTHPLMDEAVPSIINRPWFLRTMVRYRLTKIAVDNAAGPYQNHTWFLGSEKGIILKF 
LARIGSSGFLNGSLFLEEMNVYNPEKCSYDGVEDKRIMGMQLDRASGSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWVRESGSCAHLSPLSRLTFEQDIERGNTDGLG 
DCHNS FVALN GKDNVT VT I S R " 

ORIGIN 



Query Match 46.5%; Score 1437.6; DB 11; Length 3329; 

Best Local Similarity 89.1%; Pred. No. 0; 

Matches 1551; Conservative 0; Mismatches 189; Indels 0; Gaps 



Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

III II III I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 673 ATGCGGCCAGCAGCCTTACTGCTGTGTCTCACACTGCTACACTGCGCTGGGGCTGGTTTC 732 

Qy 61 C C AGAAGATT CT GAG CCAAT CAGTAT T T C GCAT GGCAACT AT ACAAAAC AGT AT C C G GT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II 
Db 733 C C AGAAGATT C CGAG CCAAT CAGTAT T T C GCAT GGCAACT AT ACAAAAC AGTAT C C G GT G 792 

Qy 121 T T T GT GG GC C ACAAGCC AGGAC G GAACAC C ACAC AGAGGC ACAGG CT GGAC AT C CAGAT G 180 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 793 T T T GT GG GC CACAAG CC AGGAC GGAACAC CAC GCAGAGGC ACAGG CT GGAC AT C CAGAT G 852 

Qy 181 ATTATGATCAT GAAC GGAACCCTCT ACATT GCT GCTAGGGAC CAT ATTTATACT GTTGAT 24 0 

II I II I I I I I I I I I I I I I I I I II I I MINIM I I I I I I I I I I I I I I I I I I I I I I 

Db 853 AT CAT GAT CAT GAACAGAACC CT CT AC GT TGCTGCTC GAGAC CAT ATT TAT ACT GT T GAT 912 

Qy 241 AT AGAC ACAT CACACAC G GAAGAAAT T TAT T GT AGCAAAAAACT GACAT G GAAAT CT AGA 300 

I I I II I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 913 AT AGAC ACAT C CCACAC AGAAGAAAT T TACT GT AGCAAAAAACT GACAT GGAAAT CT AGA 972 

Qy 301 CAG GC C GAT GT AGACAC AT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GC CACAACT TT 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I 
Db 973 CAGGCT GAC GT AGACAC AT GCAG GAT GAAGGGGAAACATAAG GAT GAAT GT CACAACT T C 1032 

Qy 361 AT T AAAGT T C T T CT AAAGAAAAAC GAT GAT GCAT T GT T TGT CT GT GGAACT AAT GC CT T C 420 

I I II I I II I M I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1033 AT T AAAGT T CT T CT CAAGAAGAAT GAT GAT AC GCT GT T T GT CT GT GGAAC CAAT GC CT T C 1092 

Qy 421 AACCCTT CCT GCAGAAACTATAAGAT GGATACATTGGAACCATTCGGGGATGAATT CAGC 480 

I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I II I I I I I II I I II III 
Db 1093 AACCCTTCCTGCAGAAACTACAGGGTCGATACCTTGGAAACTTTTGGGGATGAATTTAGC 1152 

Qy 481 GGAAT GGCCAGAT GCCCATATGATGCCAAACAT GCCAACGTT GCACTGTTTGCAGAT GGA 540 

I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I 
Db 1153 GGAAT GGCCAGAT GCCCTTAT GATGCCAAACAT GCCAACAT CGCT CTGTTT GCAGAT GGA 1212 

Qy 541 AAACT ATACT CAGC CAC AGT GACT GACTT C C TT G CC AT T GAC GC AGT CAT T TACC GGAGT 600 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1213 AAACT CT ACT C GG CTAC AGTGACT GACT T T CT G G CCAT T GAT GC AGTC AT T T ACAGGAGC 1272 

Qy 601 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 660 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I II 

Db 1273 CT CGGAGACAGCCCTACC CTCAGGACTGT CAAGCAT GATT CAAAGT GGTT GAAAGAGCC G 1332 

Qy 661 T ACTT T GTT CAAGC C GT GGAT T AC GGAGAT TAT ATCT ACT T CTT CT T C AGGGAAAT AGCA 720 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1333 T ACTT T GT C CAAG CC GT GGAT TAT GG GGAC TAT AT CT ACT T CTT CTT CAGAGAAAT T GC A 13 92 

Qy 721 GT GGAGT AT AACAC CAT GGGAAAGGT AGT T TT C C CAAGAGT GGCT CAGGT T T GTAAGAAT 78 0 

II II II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1393 GTAGAATACAACACTATGGGGAAGGTTGTTTTCCCTAGGGTGGCTCAGGTCTGTAAGAAT 1452 



Qy 781 GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGTGGACGT C GTT CCT GAAGGC GCGC 84 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 

Db 1453 GACAT GGGAGGGT CT CAGAGAGT CCT GGAGAAGCAGTGGACAT CTTT CCT GAAGGCT CGC 1512 

Qy 841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1513 CT GAACT GCTCGGTGCCTG GAGACT C T CAT TT T TAT T T CAAT AT AC T CC AGGC AGT TAC A 1572 

Qy 901 GAT GT GATT C GT AT CAAC GGGC GT GAT GT T GT C C T GGCAACGT T TT CT ACAC CT TAT AAC 960 

I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 1573 GAT GT GATT C GC AT T AAT GGCC GT GAT GT T GT CT T GGCAACCT T TT C C ACAC CT TAT AAC 1632 

Qy 961 AGC AT C C CT GGGT CT G CAGT CT GT GC CTAT GACAT GCTT GACAT T GC CAGT GT T TT T AC T 102 0 

I I I I I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I III 
Db 1633 AGCATCCCAGGTTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCTAATGTTTTCACT 1692 

Qy 1021 GGGAGAT T CAAGGAAC AGAAGT CT C CT GAT T C C AC CT GGAC AC CAGT T C CT GAT GAAC GA 108 0 

I I I I I I I I I I I I I I II I II II Mill II I I I I I II I I I I I I I I I II I I I I I I 

Db 1693 GG GAGGT T CAAGGAAC AGAAAT CAC CT GACTCT AC CT GGACAC C C GT T C CAGAC GAAC GA 1752 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

II I I I II I I I I I I I I I I M II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1753 GTCCCTAAGCCCAGGCCAGGCTGTTGTGCTGGATCATCCTCTTTAGAAAAATATGCAACC 1812 

Qy 1141 T C CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAAGAC GCAC C C GCT CAT G GAT GAG 1200 

I II I I I I I I I I II I II I II I I I I I II I I I I II I I I I I I I I I II I II I I I I I III 
Db 1813 T C CAAT GAGT TT C C C GAT GAT AC CCT GAACT T CAT T AAGACGCAT C CACT CAT G GAC GAG 1872 

Qy 1201 GC AGT GC C CT CC AT CT T CAACAGGC C AT GGT T C CT GAGAACAAT G GT CAGAT AC C GC CT T 1260 

I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1873 GC AGT GC CTT CCAT CAT CAACAGAC CT T GGTT C C T GAGAACAAT GGT CAGAT AC C GCCT G 1932 

Qy 1261 ACCAAAATTGCAGTGGACACAGCT GCT GGGCCATAT CAGAAT CACACTGT GGT TTTT CT G 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I M I I I M I 

Db 1933 ACCAAAATTGCAGTAGACAACGCT GCC GGGCCATAT CAGAAT CACACTGT GGTTTT CCT G 1992 

Qy 1321 G GAT C AGAGAAGGGAAT CAT CT T GAAGTT T TT GG C CAGAAT AG GAAAT AGT GGT TTT CT A 138 0 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I III 
Db 1993 G GAT C AGAAAAGG GAAT CAT CCT GAAGTT CTT GG C CAGGATAG GAAGCAGT GGT TT C CT A 2052 

Qy 1381 AAT GAC AGC CTTT T C CT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GCAG CT AT GAT 144 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 2053 AAT GGC AGC CTT T T C CT GGAGGAGAT GAAT GT T T ACAAC C CAGAAAAGT GCAG CTAT GAT 2112 

Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGG CAT GCAGCT GGAC AGAGCAAGCAGCT CT CT GTAT 1500 

II II I I I I I I I I II I M II I I II I I I I I I I I I I I I I I I I I I II I I I I II III 

Db 2113 GGT GT AGAAGACAAAAGGAT CAT GGG CAT GCAGCT C GAC AGAGC GAGT GGCT CACT CTAT 2172 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I II I I I II I I II I I I I II I I III I I I I II I I I I I I 

Db 2173 GTTGCATTCTCTACTTGTGTGATCAAGGTGCCTCTTGGCCGCTGTGAGCGACATGGGAAG 2232 

Qy 1561 TGTAAAAAAACCT GTATTGC CT CCAGAGACCCATATT GT GGAT GGATAAAGGAAGGTGGT 1620 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I III III I I I I Mill 
Db 2233 T GT AAAAAAAC C T G CAT C G C CT C C AG AGAC C C GTAT TGTGGGTGG GT AAG GGAAAGT GGT 2292 

Qy 1621 G C CT GCAGCCAT T TAT CAC C CAACAGCAGACT GACT T TT GAGCAGGACAT AGAGC GT GGC 1680 



1 1 1 1 1 1 1 1 I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

Db 2293 T CCT GTGC CCAT CTGTCACCC CTTAGCAGACT GACATTTGAGCAGGACATT GAGCGT GGC 2352 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 1740 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I 

Db 2353 AAT AC GGACGGC CT AG GAGACT GT CACAAT T C CT T C GT GGC ACT GAAT GGT AAGGACAAT 2412 



RESULT 4 
CB605722 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



CB605722 2411 bp mRNA linear EST 16-MAY-2003 

AMGNNUC:MRPE3-00075-D4-WY placenta embryo D17 (10379) Rattus 
norvegicus cDNA clone mrpe3-00075-d4 , mRNA sequence. 
CB605722 

CB605722.1 GI:29545334 
EST. 

Rattus norvegicus (Norway rat) 
Rattus norvegicus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 

1 (bases 1 to 2411) 
Amgen EST Program. 
Amgen Rat EST Program 
Unpublished (2003) 
Contact: Dan Fitzpatrick 
Amgen, Inc 

One Amgen Center Drive, Thousand Oaks, CA 91320-1799, USA 
Tel: 805 447-4881 

Plate: 00075 row: d column: 4. 
Location/Qualifiers 
1. .2411 

/organism="Rattus norvegicus" 
/mol_type="mRNA" 
/db_xref="taxon: 10116" 
/clone="mrpe3-00075-d4" 
/tissue_type-"placenta embryo" 
/clone_lib="placenta embryo D17 (10379)" 
/note= "Vector : pSPORTl; placenta embryo D17" 



ORIGIN 



Query Match 34.5%; 
Best Local Similarity 79.5%; 
Matches 1398; Conservative 



Score 1065.8; DB 14; 
Pred. No. 9.6e-242; 
0; Mismatches 147; Indels 



Length 2411; 

214; Gaps 



3; 



Qy 1338 CAT CT T GAAGT TT T T GGC C AGAAT AGGAAAT AGT GGT T TT CT AAAT GACAG CCTT TT C CT 1397 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 11 CGTCTTGAAGTTCTTGGCCAGGATAGGAAGCAGTGGTTTCCTAAATGGCAGCCTTTTCCT 70 



Qy 

Db 

Qy 

Db 



1398 GGAGGAGAT GAGT GTTTACAACT CTGAAAAATGCAGCTATGAT GGAGTCGAAGACAAAAG 1457 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 
71 GGAGGAGAT GAAT GTTT ACAACC CAGAAAAGTGCAGCTATGATGGT GTAGAAGACAAAAG 130 

1458 GATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTG 1517 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I II 

131 GAT CAT G GGT AT GCAG C T C GACAAAGC AAGT GGT T CACT T TAT GT T GCAT T CT CT ACT T G 190 



Qy 1518 T GT GATAAAGGT TCCCCTTGGCCGGT GT GAAC GAC AT GG GAAGT GT AAAAAAAC CT GTAT 1577 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 191 T GT GATAAAGGT GCCTCTTGGCCGCT GT GAGC GACAT GGGAAGT GT AAAAAAAC CT GTAT 250 

Qy 1578 T GC CTC CAGAGACCCATATT GT GGAT GGATAAAGGAAGGT GGT GCCT GCAGCCATTTAT C 1637 

I I I I I I I I I I I I I I I I I I I I I I I III I M I I I I I I I I I I I I I I I I I I II 
Db 251 CGCCTCCAGAGACCCATATTGTGGGTGGGTAAAGGAAACTGGTTCCTGTGCCCATCTGTC 310 

Qy 1638 AC C CAACAGC AGACT GACT T T T GAGC AGGACAT AGAGCGT GGCAAT ACAGATGGT CT GGG 1697 

I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II M 

Db 311 AC C C CT T AG C AGACT GGCT TTT GAGCAAGAC AT AGAGCGT G GCAAT ACAGACG GC CT AGG 370 

Qy 1698 GGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGTTCCCTCTTGCCCAGCAC 1757 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 371 AGACT GT CACAAT T C C T T CGT GGCACT GAAT 4 01 

Qy 1758 AAC CACAT C AGAT T C GAC G GCT CAAGAG GGGT AT GAGT CT AGGGGAGGAAT GCT GGACT G 1817 

Db 402 401 

Qy 1818 GAAGC AT CT GCT T GACT C AC CT GAC AGC ACAGAC C CT TT G GGGGCAGT GT CTT C C C AT AA 1877 

Db 402 401 

Qy 1878 T C ACCAAGACAAGAAGGGAGT GAT T C GG GAAAGT T AC CT CAAAGGC C AC GAC C AGCT GGT 1937 

I I I I I I I I I I I I I I I I I I 11 I I I I I I I II I I I I I I I I I I I I 
Db 402 GGAGT GATT C GGGAAAGT T AC CT CAAAAGCAAC GAC C AGCT CGT 445 

Qy 1938 TCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTC 1997 

Ml I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 446 TCCTGTCACCCTTTTGGCCATTGCAGTCATTCTGGCTTTTGTCATGGGGGCAGTCTTCTC 505 

Qy 1998 GG GCAT CAC C GT CTACT GCGTCTGT GAT CAT CGGCGCAAAGACGT GGCT GT GGT GC AGC G 2057 

I I I I II 1 III II II II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 506 C GGCAT CAT C GT GTAT T GT GT GT GT GAT CACC G GC G CAAAGAC GT G GC GGT AGT GCAAC G 565 

Qy 2 058 CAAGGAGAAG GAGCT CAC C CACT CGC GC C GGG GCT C CAT GAGCAGC GT C ACCAAGCT CAG 2117 

I I II I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I I M I I I I I I I I I I I 
Db 566 CAAGGAGAAAGAGCT CACCCACT CGCGT CGGGGAT CTAT GAGCAGT GT CACCAAGCT CAG 625 

Qy 2118 CGGCCTCTTTGGGGACACTCAATCCAAAGACCC7WVGCCGGAGGCCATCCTCACGCCACT 2177 

I I I I I I I I I I I I I I II III II I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I 
Db 62 6 TGGCCTCTT T GG GGACAGT CAGT C CAAG GACC CAAAGC CT GAGGCC AT C CT C ACAC CACT 685 

Qy 217 8 CAT G CAC AACG GCAAGCT C GC C ACT C CC GG CAAC AC GG C CAAGAT GCT C ATT AAAGCAGA 2237 

I I I I I I I I I I I I I I II I I I M II I I I I I I I I I I I II I I I I I I I I II II II 
Db 68 6 CAT GC ACAAT GG CAAACT GGC CACGC CT AGCAACAC CG C CAAGAT GCT CAT C AAGGCT GA 745 

Qy 2238 CCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCA 2297 

MINI III I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 74 6 CCAGCATCACTTAGACCTCACCGCCCTGCCCACCCCGGAGTCCACCCCAACACTGCAGCA 8 05 

Qy 2298 GAAGC GGAAGC C CAG C C G C GGCAGC C G C GAGT GGGAGAGGAAC CAGAAC CT CAT CAAT G C 2357 

I I I II I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 806 GAAG C GGAAAC C CAAC C GGGGCAGT C GC GAGT GG GAGAGGAAC CAGAAC CT CAT CAAT GC 8 65 



Qy 



2358 CTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCG 2417 



Db 


866 


Qy 


2418 


Db 


881 


Qy 


2478 


Db 


940 


Qy 


2535 


Db 


1000 


Qy 


2595 


Db 


1060 


Qy 


2655 


Db 


1120 


Qy 


2715 


Db 


1180 


Qy 


2775 


Db 


1240 


Qy 


2835 


Db 


1300 


Qy 


2895 


Db 


1360 


Qy 


2955 


Db 


1420 


Qy 


3015 


Db 


1480 


Qy 


3075 


Db 


1540 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CT GCAC CAAGGACAT - 



880 



GGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCA 2477 

I I I I I I I I I I I I I I I I I I I I II I I I I I I II I M I I I I I I I M I I I I I I II I I I M I I 

- GC CT C CC CAAG C C ACAT C CC C AGC GT GGT GGTCCTGCC CAT CAC ACAGCAGG GCT ACCA 939 

GCATGAGTACGT GGACCAGCC CAAAATGAGCGA GGTGGCCCAGATGGCGCTGGAGGA 2534 

I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

GCACGAATACGTAGAT CAGCCCAAAATGAGCGAGGT GGT GGCT CAGAT GGCACTGGAGGA 999 

CCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACATCT CAGCAGCAAGAGT CCCAA 2594 

M I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I M 

CCAGGCTGC CACCCT GGAGTATAAGACCATCAAAGAGCACCT GAGCAGCAAGAGT CCCAA 1059 

CCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGA 2 654 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

C CAT GGGGT GAACCT T GT GGAGAAC CT GGACAGC CT G C C CC C CAAAGT T CC ACAGC GT GA 1119 

GGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGA 2714 

I I I I I I I I I I I I I I I I I I I M I I I I M I I I MINIM II II I II I II II I I I I 

GGCCTCTCTGGGTCCCACGGGAGCCTCACTGTCCCAGACCGGCCTGAGCAAGCGGCTGGA 1179 

AAT G CAC C ACT C CT CTT C CT AC GGGGT T GACTATAAGAGGAGCT AC C C CAC GAACT C GCT 2774 

M I I I I I I M I I II I I II I M M M M I I I I II II I II I I I I II I I I I I II II I I I 

AAT GCAAC ACT C CT C CT CCTACG GGCT TGAAT AT AAGAGGAGCT AC CC CAC GAACT C GCT 1239 
CAC GAGAAGC C ACC AGG C CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAATT C CT C 2 834 

Ml M I I I II I I I I I I I I I II I I I I I I I I II I II II I I I I II I I I I I M II I II I II 

CACAAGAAGC CAT C AGGC CAC CACT CT CAAAAGAAACAAT ACTAACT C CT C CAAT T C CT C 1299 

T CAC CT CT CCAGAAACC AGAGCT T T GG CAG GGGAGAC AAC C C GC C GC CC GC C CC GCAGAG 2894 
I M I II I II I I II I I I I I I I II I I I I II II I I I II I II II I I II I I I M I II I I 

CCACCTCTCCAGGAACCAGAGCCTTGGCCGGGGAGACAACCCACCTCCCGCCCCGCAGAG 1359 
G GT GGACT C CAT C CAG GT GC ACAGCT C C CAGC C AT CT GGCCAG G C CGT GACT GT CT C GAG 2954 

I I I II I II I I I I II I II I I I I M I II II I I I M I I I I II I I II I I I II I II Mill 

GGTGGACTCTATCCAGGTGCACAGCCCCCAGCCCTCTGGCCAGGCCGTGACTGTTTCGAG 1419 

GCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTC 3014 

M I I II II II I I II I II I I I II II I II I II I I I II I I II I II I I I II M II II I I I 

GCAGCCCAGCCTCAATGCCTACAACTCACTGACGAGGTCGGGGCTGAAGCGCACCCCCTC 147 9 

GCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATGAAGCC 3074 

I I I M I I I I II II II I I II II I I I I M II I I II I I I II I I I I I I I II I II II M II 

GCTAAAGCCAGATGTACCCCCCAAACCTTCCTTTGCCCCCCTTTCCACATCCATGAAGCC 1539 

CAAT GAT GC GT GT ACAT AA 3093 

II II I I I I I I I I I II I I I I 
CAAT GAT GC GT GT ACAT AA 1558 



RESULT 5 
BM450002 

LOCUS BM450002 1030 bp mRNA linear EST 05-EEB-2002 

DEFINITION AGENCOURT_6393382 NIH_MGC_72 Homo sapiens cDNA clone IMAGE: 5528003 
5', mRNA sequence. 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BM450002 

BM450 002. 1 GI: 18499042 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1030) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: ATCC/DCTD/DTP 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http: //image . llnl . gov 

Plate: LLAM12204 row: c column: 12 
High quality sequence stop: 733. 

Location/Qualifiers 

1. .1030 

/organism="Homo sapiens" 
/mol_type="mRNA M 
/db_xref="taxon: 9606" 
/clone="IMAGE: 5528003" 
/tissue_type="rnelanotic melanoma" 
/lab_host="DHlOB (phage-resistant ) " 
/clone_lib="NIH_MGCJ72" 

/note="Organ: skin; Vector: pCMV-SP0RT6; Site_l: NotI; 
Site_2: Sail; Cloned unidirectionally . Primer: Oligo dT. 
Average insert size 2 kb. Library constructed by Life 
Technologies . " 



ORIGIN 



Query Match 29.1%; 
Best Local Similarity 97.4%; 
Matches 956; Conservative 



Score 899.4; DB 12; 
Pred. No. 2.2e-202; 
0; Mismatches 19; 



Length 1030; 
Indels 7; Gaps 



4; 



Qy 


787 


Db 


1 


Qy 


847 


Db 


61 


Qy 


907 


Db 


121 


Qy 


967 


Db 


181 



GGAGGAT CT CAAAGAGT CCT G GAGAAAC AGT GGACGT C GT T CCT GAAG GC GCGC T T GAAC 846 
I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I i I I I I I I I I I I 
GGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGACGTCGTT CCTGAAGGC GCGCTT GAAC 60 

T GCT CAGTT C CT GGAGACT CT CAT T T TT AT TT C AACAT T CT CCAG G CAGT T AC AGATGT G 906 

M I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I 

T GCT CAGTT C CT GGAGACT CT CAT T T TT AT T T CAACAT T CT CCAGGCAGTT AC AGAT GT G 120 

ATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAACAGCATC 966 
I I I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 
ATT C GTAT CAACGGGC GT GAT GT T GT CCT GGCAAC GTT T T CT AC AC CT T ATAAC AGC AT C 18 0 

CCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACTGGGAGA 1026 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

C CT G GGT C T GCAGT CT GT G C CT AT GAC AT GCTT GACAT T G C CAGT GT TT T TACT G GGAGA 24 0 



Qy 1027 T T CAAGGAAC AGAAGT CT C CT GAT T C C AC CT GGAC ACCAGT T C CT GAT GAAC GAGT T C CT 108 6 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 241 T T CAAGGAAC AGAAGT CT C CT GAT T C C ACCT G GAC ACCAGT T C CT GAT GAAC GAGT T C CT 300 

Qy 1087 AAG CC C AGGC C AGGT T GC T GT GC T GG CT CAT C CT C CT T AGAAAGATAT GCAAC CT C CAAT 114 6 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 301 AAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACCTCCAAT 360 

Qy 1147 GAGTT C C CT GAT GAT ACC CT GAACTT C AT CAAGAC GC AC C CG CT CAT GGAT GAGGC AGT G 1206 

I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 361 GAGTT CC CT GAT GAT ACCCT GAACTT CATCAAGAC GCACCCGCT CAT GGAT GAGGCAGT G 420 

Qy 1207 C C CTC C AT CT T CAAC AGGC CAT GGTT C CT GAGAACAAT GGT CAGAT AC C GC CT TAC CAAA 1266 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 421 C C CT C C ATCT T CAACAGGC CAT GGTT C CT GAGAACAAT GGT CAGAT AC C GC CT TAC CAAA 480 

Qy 12 67 ATT GCAGTGGACACAGCT GCTGGGCCATATCAGAATCACACT GTGGTTTTT CT GGGATCA 132 6 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 481 ATT GC AGT G GACACAGCT G CT GG GCC AT AT C AGAAT CACACT GTGGTTTTTCT GGGAT C A 540 

Qy 1327 GAGAAG GGAAT CAT CTT GAAGT T TTT GGCC AGAAT AGGAAAT AGT GGT T TT CTAAAT GAC 1386 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GAGAAGGGAAT CAT CTTGAAGTTTTT GGCCAGAATAGGAAATAGTGGTTTT CTAAAT GAC 600 

Qy 1387 AGC CT T T T C CT GGAG GAGAT GAGT GT T T ACAACT CT GAAAAAT GCAGC T AT GAT GGAGT C 1446 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 601 AG C CT T T T C CT GGAGGAGAT GAGT GT T TACAACT CT GAAAAAT GCAGCT AT GAT GGAGT C 660 

Qy 1447 GAAGACAAAAG GAT CAT GGGCAT GCAGCT GGACAGAG CAAGCAGCT CT CT GT ATGT T GC G 150 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GAAGACAAAAGGAT CAT G G GC AT GCAGCT GGACAGAGCAAGCAGCT CT CT GT AT GT T GC G 72 0 

Qy 1507 TTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGT-AA 1565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I I I I II I 

Db 721 TTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAAAGTGTA 780 - 

Qy 1566 AAAAAC CT GT ATT GC CT C CAGAGAC C CAT AT T GT G GAT GGAT AAAGGAAGGT GGT GCCT G 162 5 

I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 781 AAAAAC CT GT ATT GC CT C CAGAGACC CAT AT T GT GGAT GGAT AAAAGAAG GT GGT GC C T G 84 0 

Qy 1626 CAGCCATTTAT CACCCAACAGCAGACT GACTTTT GAGCAGGACATAGAGCGT GGCAAT AC 1685 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CAGN CATTTATCACCCAACAGCAGACT GACTTTTGAGCAGGACATAGAGCGT GGCAAT AC 900 

Qy 1686 AGAT - GGT CT GGGGGACT GT CAC — AATT C CT TT GTGGCACT GAA T GGGCAT TCCAG 1739 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 901 AGATGGGTCTGGGGGAATGTCACCAATTCCTTTGTTGGCACTGNAATGGGGCATTTCAAG 960 

Qy 174 0 TTCCCTCTTGCCCAGCACAACC 1761 

I I I I I I II I I I I I I I I I I I I 

Db 961 TTCCCTCTTGCCCAGNACAAAC 982 



RESULT 6 
BM546059 

LOCUS BM546059 1183 bp mRNA linear EST 20-FEB-2002 

DEFINITION AGENCOURT 6497880 NIH_MGC_125 Homo sapiens cDNA clone IMAGE : 5588479 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



5 1 , mRNA sequence. 
BM546059 

BM546059.1 GI:18778712 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1183) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Invitrogen 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLAM12359 row: k column: 08 
High quality sequence stop: 725. 

Location/Qualifiers 

1. .1183 

/organism="Homo sapiens" 

/mol_type-"mRNA" 

/db_xref="taxon: 9606" 

/clone="IMAGE: 5588479" 

/labJiost="DH10B" 

/ cl one__l ib= "N I H_MGC_12 5 " 

/note="Organ: ovary (pool of 3); Vector: pCMV-SP0RT6; 
Site__l: EcoRV (destroyed); Site_2: NotI; RNA source pool 
of three ovaries, from females ranging in age from 38 to 
49 yo. Library is oligo-dT primed and directionally cloned 
(EcoRV site is destroyed upon cloning) . Average insert 
size 2.1 kb, insert size range 1-3.5 kb . Library is 
normalized and enriched for full-length clones and was 
constructed by C. Gruber (Invitrogen) . Research Genetics 
tracking code 036." 



ORIGIN 



Query Match 29.0%; Score 896; DB 12; Length 1183; 

Best Local Similarity 99.0%; Pred. No. 1.5e-201; 

Matches 932; Conservative 0; Mismatches 6; Indels 3; 



Gaps 



3; 



Qy 2152 AAGCCGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAAC 2211 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 ATGCCGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAAC 77 

Qy 2212 AC GG C CAAGATG CT CAT T AAAGCAGAC CAGCAC C AC CT GGAC CT GAC GG C C CT C C C C AC C 2271 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 78 AC G GC CAAGAT GCT CATT AAAGCAGAC C AG CAC C AC CT GGAC CT GAC GG C C CT C C CC AC C 137 



Qy 2272 C CAGAGT CAAC C C CAAC G CT GCAG C AGAAG CGGAAG C C CAG C C GC GG CAGC CG C GAGT GG 2331 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I II I 
Db 138 C CAGAGT CAAC C C CAAC G CT G CAGC AGAAGCG GAAG C C CAGC C GC GGCAGC CG C GAGT G G 197 



Qy 2332 GAGAGGAAC CAGAAC CTC AT CAAT GC CT G C ACAAAG GACAT GC C C CC C AT GGGCT C C C CT 23 91 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I 1 I I I I I I I I I I I r 
Db 198 GAGAGGAAC CAGAAC CT C AT CAAT GC CT G CACAAAG GACAT GC C C CC CAT GGGCT C C C CT 257 



Qy 2392 GTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTC 24 51 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 258 GTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTC 317 

Qy 2452 CT GC CCAT CAC G CAGCAGGGCT ACCAGCAT GAG T AC GT GGAC CAGC C CAAAAT GAGCGAG 2511 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 318 CT GC C CAT CAC G CAGC AGGG CT ACCAGCAC GAGT AC GT GGAC CAGC C CAAAAT GAGCGAG 37 7 

Qy 2512 GTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGAGTATAAGACCATCAAGGAA 2571 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 

Db 378 GTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGAGTATAAGACCATCAAGGAA 437 

Qy 2572 C AT CT CAG CAGCAAGAGT C C CAACCAT GG GGT GAAC CTT GT GGAGAAC CT G GACAGCCT G 2631 

I I I I II I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 438 CAT CT CAGCAGCAAGAGT C C CAACCAT GGGGT GAAC CT T GT GGAGAAC CT GGACAGC CT G 497 

Qy 2632 CCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAG 2691 

I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
Db 498 CCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAG 557 

Qy 2692 ACCGGTCTAAGCAAGCGGCTGGAT^ATGCACCACTCCTCTTCCTACGGGGTTGACTATAAG 2751 

M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I 
Db 558 ACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAG 617 

Qy 2752 AGGAGCT AC C C CAC GAACT C G CT CAC GAGAAGC CAC C AGGC CAC CACT CT CAAAAGAAAC 2811 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Db 618 AGGAGCT AC C C CAC GAACT CGCT CAC GAGAAGC CAC CAGGN CAC CAC T CT CAAAAGAAAC 677 

Qy 2812 AACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGAC 2 871 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 678 AACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGAC 737 

Qy 2872 AAC C C GC C GC C C GC C C C GCAGAGGGT GGACTC CAT C CAG GT GCACAG CTC C CAGC CAT CT 2931 

I I I I I I II I I I I I I I I II II I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 738 AAC CCGCCGCCC GC C CC GCAGAG GGT GGACT C CATC CAGGT GCACAG CT C C CAGC CAT CT 797 

Qy 2932 GGC C AGGC CGT GAC T GT CT CGAGGCAGC C CAG C C T CAAC GC CT ACAACT C ACT GACAAG G 2 991 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 798 GGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAAG 857 

Qy 2992 TC-GGGGCTGAAGCGTACG-CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTG 3049 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 858 TCGGGGGCTGAAGCGTACGCCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTG 917 

Qy 3050 CTCCCCTTTCCACATCCATG-AAGCCCAATGATGCGTGTAC 3089 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 918 CTCCCCTTTTCACAT CCAT GAAAGCC CCAT GAT GCGTGT AC 958 

RESULT 7 
AU140366 

LOCUS AU140366 868 bp mRNA linear EST 05-AUG-2002 



DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 



JOURNAL 
COMMENT 



FEATURES 

source 



AU140366 PLACE2 Homo sapiens cDNA clone PLACE2000407 5', mRNA 

sequence . 

AU140366 

AU140366.1 GI:11001887 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 868) 

Ota,T., Suzuki, Y. f Saito,K., Ishii,S., Yamamoto,J., Sugiyama, T . , 
Nishikawa, T . , Nakamura, Y. , Sugano,S., Masuho,Y. and Isogai,T. 
HRI human cDNA project (Ota,T., Suzuki, Y., Saito,K., Ishii,S., 
Yamamoto,J., Sugiyama, T., Nishikawa, T . , Nakamura,Y., Sugano,S., 
Masuho,Y., Isogai,T.) 
Unpublished (2000) 
Contact: Takao Isogai 
Genomics Laboratory 
Helix Research Institute 

1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
Tel: 81-438-52-3975 
Fax: 81-438-52-3986 
Email: genomics@hri.co.jp 

HRI human cDNA project; 5 1 - & 3' -end one pass sequencing: Helix 
Research Institute; cDNA library construction: Department of 
Virology, Institute of Medical Science, University of Tokyo, and 
Helix Research Institute. 

Location/ Qualifiers 

1. .868 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone="PLACE2 000407" 

/tissue_type="placenta" 

/clone_lib="PLACE2 M 

/note- M Vector: pME18SFL3" 



ORIGIN 



Query Match 26.8%; 
Best Local Similarity 98.3%; 
Matches 855; Conservative 



Score 828.2; DB 9; 
Pred. No. 1.7e-185; 
0; Mismatches 13; 



Length 868; 
Indels 2; 



Gaps 



2; 



Qy 



Db 



368 TT CT T CT AAAGAAAAAC GAT GAT GCAT T GT T TGT CT GT GGAACT AAT GC CT TCAAC C CTT 427 
I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
1 TT CTT CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACTAAT GC CT T CAAC C CT T 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 



42 8 CCT GCAGAAACT AT AAGAT GGAT ACAT T GGAACCAT T C GGGGAT GAATT C AGC GGAAT GG 487 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
61 CCT GCAGAAACTAT AAGAT GGAT ACATT G GAAC CAT T CGGGGAT GAATT CAGC G GAAT GG 12 0 

48 8 CC AGAT GC C CAT AT GAT GC CAAACAT GCCAAC GT T GCACT GT T T GCAGAT GGAAAACT AT 547 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I 
121 CCAGAT GCCCATAT GAT GCCAAACAT GCCAAC GTT GCACT GTTT GCAGAT GGAAAAC TAT 18 0 

54 8 ACTCAGCCACAGTGACTGACTTCCTTGCCATTGACGCAGTCATTTACCGGAGTCTTGGAG 607 

I I I || I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I 

181 ACTCAGCCACAGTGACTGACTTCCTTGCCATTGACGCAGTCATTTACCGGAGTCTTGGAG 24 0 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



608 AAAGC C CT AC C CT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC C ATAC TT T G 
I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I li I I I T I I I I I I ITT I I 
241 AAAGC C CT AC C CT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC C ATACTT T G 



668 



301 



728 



361 



788 



421 



848 



481 



908 



541 



968 



601 



T T CAAGC C GT GGAT T AC GGAGATTAT AT CT ACT T C T T CT T CAGGGAAAT AG C AGT G GAGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

TTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCAGTGGAGT 

ATAACAC CAT GGGAAAGGTAGTTTT CCCAAGAGT GGCT CAGGTTT GTAAGAAT GAT AT GG 
I I I M I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I I I I I I I I I I 
ATAACAC CAT GGGAAAGGTAGTTTT CCCAAGAGT GGCT CAGGTTT GTAAGAAT GAT AT GG 

GAGGAT CT CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GCTT GAACT 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
GAGGAT CT CAAAGAGT CCT GGAGAAAC AGTGGAC GT CGTTCCT GAAGGCGCGCTT GAACT 



667 



300 



727 



360 



787 



420 



■ 847 



480 



907 



GCT CAGT T C CT GGAGACT CT C ATTT T T AT TT CAACAT T CT C CAGG C AGT T AC AGAT GT GA 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCT CAGT T C CT GGAAACT CT C ATT T T T AT TT CAACAT T CT C CAG G CAGT T AC AGAT GT GA 540 

T T CGTAT CAAC G GG C GT GAT GT T GT C CT GGCAAC GTT T T CT ACAC CTT ATAACAGCAT C C 967 
I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I 
T T CGTAT CAAC GGGC GT GATGT T GT C CT GGCAAC GT T T T CT ACAC CTT AT AACAGCAT C C 600 

CT GGGT CT GCAGT CT GT G C CT ATGAC AT GCTT GAC AT T G CCAGT GT TT T TACT GG GAGAT 1027 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
CTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACTGGGAGAT 660 



102 8 TCAAGGAACAGAAGT CTCCTGATT CCAC CTGGACACCAGTT CCT GATGAACGAGTT CCTA 1087 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
661 T CAAG GAACAGAAGT CTN CT GATT C C AC CT GGAC ACCAGTT CCT GAT GAAC GAGTT C CTA 720 

1088 AGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACCTCCAATG 1147 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 AGC C CAG G CCAGGT TGCTGTGCTGGCT CAT C CTN CTT AGAAAGAT AT GCAAC CT T CAAT G 780 

1148 AGT T C CCT GAT GAT ACC CT GAACT T CAT CAAGAC GCAC C C GCT CAT G GAT GAGGC AGT GC 1207 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I i I I I I I M I I I I III III 
781 AGTT C CCT GAT GAT - CC CT GAACT TNAT CAAGAC G CAC C C GT T CAT GGAT GA- GCAAT G C 838 

12 08 CCTCCATCTTCAACAGGCCATGGTTCCTGA 1237 
III III II I I I I I I I I I I I I I I I I 
839 CCTTCATTTTNAACAGGGCATGGGTNCTGA 868 



RESULT 8 
BU186963 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



BU186963 891 bp mRNA linear EST 04-SEP-2002 

AGENCOURTJ778572 3 NIH_MGC_67 Homo sapiens cDNA clone IMAGE : 6138529 
5 ! , mRNA sequence. 
BU186963 

BU186963. 1 GI: 22700947 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 891) 

AUTHORS NIH-MGC http://mgc.nci.nih.gov/. ' v ' v 

TITLE National Institutes of Health, Mammalian Gene Collection (MGC) 

JOURNAL Unpublished (1999) 
COMMENT Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: ATCC 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http://image.llnl.gov 
Plate: LLAM13454 row: b column: 02 
High quality sequence stop: 677. 
FEATURES Location/Qualifiers 
source 1. .891 

/organism="Homo sapiens 11 

/mol_type^ ,, mRNA" 

/db_xref="taxon: 9606" 

/clone="IMAGE: 6138529" 

/ tissue_type=" retinoblastoma" 

/lab_host="DH10B (phage-resis tant ) " 

/clone_lib="NIH_MGC_67" 

/note="0rgan: eye; Vector: pCMV-SP0RT6; Site_l : NotI; 
Site_2: Sail; Cloned unidirectionally . Primer: Oligo dT. 
Average insert size 1.75 kb. Library constructed by Life 
Technologies . " 

ORIGIN 

Query Match 26.3%; Score 813.8; DB 13; Length 891; 

Best Local Similarity 97.3%; Pred. No. 4.5e-182; 

Matches 860; Conservative 0; Mismatches 18; Indels 6; Gaps 3; 



Qy 94 6 TCT AC AC CT T ATAACAG CAT CC CT GGGT CT GC AGT CT GT GCCTAT GACAT GCTT GACAT T 1005 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 8 TCCGCACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATT 67 



Qy 1006 GCCAGT GTTTTT ACTGGGAGATTCAAGGAACAGAAGT CT CCT GATT CCACCTGGACACCA 1065 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
Db 68 GCCAGTGTTTTTACTGGGAGATTCAAGGAACAGAAGTCTCCTGATTCCACCTGGACACCA 127 



Qy 1066 GTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTA 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 128 GTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTA 187 



Qy 1126 GAAAGATATGCAACCT CCAATGAGTT CCCT GAT GATACCCTGAACTT CAT CAAGACGCAC 1185 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 188 GAAAGATATGCAACCT C CAATGAGTTCCCT GAT GATACCCTGAACTT CAT CAAGACGCAC 247 

Qy 1186 CC GCT CAT G GAT GAGG CAGT GC C CT C CAT CT T CAACAGG C CAT G GT T CCT GAGAACAAT G 1245 

I I I I I I I I I I I I I M I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 248 CC G CT CATGGAT GAGGC AGT GC C CT C CAT CT T CAACAGG C CAT GGT T CCT GAGAACAAT G 307 



Qy 



1246 



GT C AGAT AC C GCCT T AC CAAAAT T GCAGT GGAC AC AGCT GCT GGGC CAT AT C AGAAT CAC 1305 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 



Db 



308 



GT CAGAT AC CG C CT T ACCAAAAT T GCAGT GGAC ACAGCT G CT G GGCCATAT CAGAAT CAC 367 



Qy 1306 ACTGT GGTTTTTCT GGGAT CAGAGAAG GGAAT C AT CT T GAAGT T T TT GGC CAGAAT AGGA 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 368 ACTGT GGTTTTTCT GGGAT CAGAGAAGGGAATCATCTTGAAGTTTTTGGCCAGAAT AGGA 427 

Qy 1366 AATAGT GGT TTT CTAAAT GACAG CCT TT T C CT GGAGGAGAT GAGT GT T T ACAACT CT GAA 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 8 AATAGT GGT TTT CTAAAT GACAGCCTT TT CCT GGAGGAGAT GAGT GTTT ACAACT CTGAA 487 

Qy 1426 AAAT GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GGG CAT GCAG CT GGACAGAGCA 14 85 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 488 AAAT GC AGC T AT GAT GGAGT C GAAGACAAAAGGAT CAT GGG CAT GCAGCT GGACAGAGCA 547 

Qy 14 8 6 AGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGT 1545 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 
Db 54 8 AGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGT 607 

Qy 1546 GAACGACATGGGAAGT GTAAAAAAACCTGTATT GCCT CCAGAGACCCATATT GT GGAT GG 1605 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 608 GAACGACAT GGGAAGT GTAAAAAAACCTGTATT GCCT CCAGAGACCCATATT GT GGAT GG 667 

Qy 1606 ATAAAGGAAGGTGGT GCCT GCAGCCATTTAT CACCCAACAGCAGACT GACTTTT GAGCAG 1665 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 668 ATAAAGGAAGGT GGT GCCT GCAGCCATTTAT CAC CCAACAGCAGACT GACTTTT GAGCAG 727 

Qy 1666 GACATAGAGCGT GGCAAT ACAGAT - GGTCT GGGGGACT GT CACAATT CCTTT GT GGCACT 1724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 
Db 728 GACATAGAGCGT GGCAAT ACAGAT GGGTCT GGGGGACT GT CACAATT C CTTT GT GGCACT 787 

Qy 1725 GAAT G GGC ATT C CAGT TCCCTCTTGCC C AGCAC AAC C ACAT CAGATT C GAC GGCT CAAGA 17 84 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 

Db 78 8 GAAT GGGC ATT C CAGT TCCCTCTTGCC CAGCAC - AC CACAT CAGATT CAC GGCT CAAN GA 84 6 

Qy 1785 GGGGTATGA GT CTAGGGGAGGAATGCTGGACT GGAAGCAT 1824 

I I I I I I I I I III I I II I I I I I I I I M I II I I I 

Db 847 AGGGT AT GAAGT CCTAAGGGGAGGAAATGCTGGACT GGAAGCAT 890 



RESULT 9 
BG769297 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BG769297 887 bp mRNA linear EST 15-MAY-2001 

602742838F1 NIH_MGC_49 Homo sapiens cDNA clone IMAGE : 4872704 5', 
mRNA sequence. 
BG769297 

BG769297.1 GI:14079950 
EST . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 887) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r@mail . nih . gov 



FEATURES 

source 



Tissue Procurement: ATCC/DCTD/DTP 
cDNA Library Preparation: Ling Hong/Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http://image.llnl.gov 
Plate: LLCM1749 row: k column: 09 
High quality sequence stop: 862. 
Location/ Qualifiers 
1. .887 

/organism= n Homo sapiens" 
/mol_type="mRNA" 
/db_xref ="taxon : 9606" 
/ clone-" IMAGE: 4872704" 

/ tissue_type="melanotic melanoma, high MDR (cell line)" 
/lab_host="DH10B (phage-resis tant ) " 
/ cl one_l i b= " N I H_MGC_4 9 " 

/note="Organ: skin; Vector: pOTB7 ; Site_l: Xhol; Site_2 : 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRl/XhoI sites using the following 5' adaptor: 
GGCACGAG(G). Size-selected >500bp for average insert size 
1.8kb. Library constructed by Ling Hong in the laboratory 
of Gerald M. Rubin (University of California, Berkeley) 
using ZAP-cDNA synthesis kit (Stratagene) and Superscript 
II RT (Life Technologies). Note: this is a NIH__MGC 
Library. | " 



ORIGIN 



Query Match 2 5.4%; 

Best Local Similarity 95.8%; 
Matches 849; Conservative 



Score 784.4; DB 12; Length 887; 
Pred. No. 4.4e-175; 
0; Mismatches 31; Indels 6; 



Gaps 



4; 



Qy 



Db 



1903 CGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCA 1962 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 CGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCA 61 



Qy 



Db 



1963 GTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGT 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

62 GTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGT 12 1 



Qy 

Db 

Qy 

Db 

Qy 

Db 



2023 GATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCG 2082 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

122 GATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCG 181 

2083 CGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCC 2142 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II 

182 CGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCC 241 

2143 AAAGAC C CAAAG C C GGAGGCC AT CCT CAC G CC ACT CAT G C ACAAC G GCAAGCT CGC CACT 2202 
I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

242 AAAGAC C CAAAGC C GGAGGCC AT CCT CAC G C CACT CAT GCACAAC GGCAAGCT C GC CACT 301 



Qy 

Db 



2203 
302 



2262 
361 



Qy 22 63 CTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGC 2322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3 62 CT C C C C AC CC C AGAGT CAAC C C CAACGCT GCAGC AGAAG CGGAAGC C C AGC C GCG GCAGCT 421 

Qy 2323 C GC GAGT GGGAGAGGAAC C AGAAC CT C AT CAAT G C CT GCACAAAGGAC AT GC CC C C CAT G 2382 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 422 C GC G AGT GGGAGAG GAAC C AGAAC CT CAT CAAT GC CT GCACAAAG GAC AT G C CC C C CAT G 4 81 

Qy 2383 GGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGC 2442 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 82 GGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGC 541 

Qy 24 43 GT GGT GGT C CT G CC CAT C ACG CAGCAGGGCT ACC AGCAT GAGT AC GT G GAC CAGC C CAAA 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 542 GT G GT GGT C CT GCC CAT C ACG CAGC AGGG CT AC CAGC AT GAGT AC GT G GAC CAGGC CAAA 601 

Qy 2503 AT GAGCGAGGT GGC C CAGAT GGC GCT GGAGGACC AGGC C GC CAC ACT G GAGT AT AA- GAC 2561 

I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I III 
Db 602 AT GAGCGAGGT GGC C CAGAT GGC GCT GGAGGACC AGGC C GC CAC ACT GGAG TAT AAGGAC 661 

Qy 25 62 CAT CAAGGAAC AT CT CAGC AGCAAGAGT C CCAAC CAT - GGGGT GAAC CTT GT GGAGAAC C 2620 

I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 662 C ATCAAGGAACAT CT CAGCAGCAAGAGT C CCAAC C AT GG GGGT GAAC CTT GT GGAGAAC C 721 

Qy 2621 TGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGA— GC 2678 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 722 TGGACAGCCTGCCCCCCGATAGTTCACAGCGGGAGGCCTCCCTGGGTCCACCGGTAAGCC 781 

Qy 2679 CTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGG 27 38 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 82 TCCCTGTTCTTAGACCGGTCTAAGCAAGCGGCTGGAATTGCACCACTCCTCTTCCTAACG 841 

Qy 2739 GGTT — GACTATAAGAGGAGCTACCC CACGAACT CGCT CACGAGAA 2782 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 42 GG GT AGACT TAT AAGAGGAGCTAAC CAAGGAAT C GGTT C AAGAGGA 8 87 



RESULT 10 

AL543344 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



AL543344 1201 bp mRNA linear EST 31-MAY-2003 

AL543344 Homo sapiens PLACENTA COT 25-NORMALIZED Homo sapiens cDNA 
clone CS0DI001YL17 5-PRIME, mRNA sequence. 
AL543344 

AL543344.2 GI: 31265191 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1201) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On Feb 15, 2001 this sequence version replaced gi: 12875822. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 



FEATURES 

source 



Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies , a division of 
Invitrogen. This sequence belongs to sequence cluster 28 64 1 r' 1 For 
more information about this cluster, see 
http : / /www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DI001CF09QPl&cluster=2864 . r . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DI001CF09QP1 . 

Location/ Qualifiers 

1. .1201 

/organism-"Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DI001YL17" 

/tissue_type="PLACENTA COT 25-NORMALIZED" 
/clone_lib="Homo sapiens PLACENTA COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 25.3%; 
Best Local Similarity 96.4%; 
Matches 8 38; Conservative 



Score 783.4; DB 9; 
Pred. No. 9.1e-175; 
5; Mismatches 21; 



Length 1201; 
Indels 5; 



Gaps 



4; 



Qy 



Db 



1714 T TT GT G GCACT GAAT GGGCAT T CC AGTT CCCTCTTGCC CAGCACAAC CAC AT CAGATT C G 1773 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

221 T T T GT GAT GAAAAC AGGGCAT T CC AGTT C CCT CT T GC C CAGCACAAC CACAT CAGATT C G 280 



Qy 

Db 

Qy 

Db 



1774 ACGGCTCAAGAGGGGTAT GAGT CT AGGGGAGGAAT GCT GGACT GGAAGCAT CT GCTT GAC 1833 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
ACGG CT CAAGAG GGGTAT GAGT CT AGGGGAGGAAT GCT GGACT G GAAG CAT CT G CT T GAC 340 



281 



1834 T CACCTGACAGCACAGAC CCTTTGGGGGCAGT GTCTT CCCATAAT CACCAAGACAAGAAG 1893 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I It I I I I I I I I I I I I I I I I I I I I I I I I I 

341 T CAC CT GACAGCACAGAC CCT TT GG GGGCAGT GT CTT C CC ATAAT CAC CAAGACAAGAAG 4 00 



Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



1894 GGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTG 1953 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTG 



401 



460 



1954 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 2 013 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 520 



461 



2014 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 2 073 

I I M II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I 

TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 580 



521 



2074 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2133 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
581 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 640 



Qy 



2134 



AC T CAAT C CAAAGAC CCAAAGC CGGAGGC C AT CCT CAC GC C ACT CAT GCACAAC GGCAAG 
I I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



2193 



Db 



641 ACT CAAT C CAAAGAC C CAAAGC C GGAG G - CAT C CT C AC GC CACT C ATGCACAAC GG CAAG 



699 



Qy 2194 CTCGCCACTCCCGGCAACACGGCCAAGATGCTCATTAAAGCAGACCAGCACCACCTGGAC 2253 

I I I I I I I I I I I M I I I I I I | M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 7 00 CTCGCCACTCCCGGCAACACGGCCAAGATGCTCATTAAAGCAGACCAGCACCACCTGGAC 759 

Qy 2254 CTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGC 2313 

I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 60 CTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGC 819 

Qy 2314 C GC G GC AG C C GC GAGT GGGAGAGGAAC CAGAAC CT C AT CAAT G C C T GCACAAAGGACAT G 2373 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 820 C GC GGCAGC C GC GAGT GGGAGAGGAAC CAGAAC CT CAT CAAT G C CT GCACAAAGGACAT G 87 9 

Qy 237 4 CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 2433 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I 
Db 880 CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 939 

Qy 2434 AT C C CCAGC GT GGT GGTCCTGCC CAT C AC GC AGCAGG G CT AC C AGCAT GAGT ACGT GGAC 2493 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
Db 94 0 ATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGAC 999 

Qy 24 94 CAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGAG 2553 

II I I I I I I I I I M I II I I I I I I I I I II I I I I I : I : I I I I I I I : I I I I I I I I I I 

Db 1000 — AGCCCAAAT GAGC GAGGT GG- CCAGAT GGCGCT GGARGRCCAGG- CGS CACACT GGAG 1055 

Qy 2554 T AT AAGAC CAT CAAGGAAC AT C T CAG C AG 2582 

I : I I I I I I I I I I : I I I I I I 

Db 1056 TWT AAGAC AT CAAGGAAAT T YAG CAG CAG 1084 



RESULT 11 

BQ678536 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BQ678536 848 bp mRNA linear EST 15-JUL-2002 

AGENCOURT_82 0815 9 NIH_MGC_112 Homo sapiens cDNA clone IMAGE: 6262572 
5 1 , mRNA sequence. 
BQ678536 

BQ67 8536. 1 GI : 21791215 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 848) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: DCTD/DTP 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLCM2425 row: b column: 13 



High quality sequence stop: 695. 
FEATURES Location/Qualifiers 
source 1. .848 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 6262572" 

/tissue_type="melanotic melanoma, cell line" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib="NIH_MGC_112" 

/note="Organ: skin; Vector: pOTB7; Site_l: Xhol ; Site_2: 
EcoRI ; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRl/XhoI sites using the following 5' adaptor: 
GGCACGAG (G) . Library constructed by Ling Hong in the 
laboratory of Gerald M. Rubin (University of California, 
Berkeley) using ZAP-cDNA synthesis kit (Stratagene) and 
Superscript II RT (Life Technologies) . Note: this is a 
NIH_MGC Library. " 

ORIGIN 

Query Match 25.2%; Score 779.4; DB 13; Length 848; 

Best Local Similarity 98.1%; Pred. No. 6.6e-174; 

Matches 830; Conservative 0; Mismatches 12; Indels 4; Gaps 4; 

Qy 12 86 CT G G GC CAT AT CAGAAT C AC ACT GT GGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CT T GA 134 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CT GGGC C AT AT CAGAAT CACACT GT GGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CT T GA 60 

Qy 1346 AGT T TT T GGC CAGAAT AG GAAATAGT GGT TT T CT AAAT GACAGC C T TT T C CT GGAGGAGA 14 05 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | 
Db 61 AGT T TTT GGC CAGAAT AG GAAATAGT GGT TT T CTAAAT GACAGC CT TT T C CT GGAGGAGA 12 0 

Qy 14 06 T GAGT GT T T ACAACT CT GAAAAAT G C AG CTAT GAT GGAGT CGAAGACAAAAGGAT CAT GG 14 65 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 T GAGT GT T T ACAAC T C T GAAAAAT GCAGCT AT GAT GGAGT CGAAGACAAAAG GAT CAT GG 18 0 

Qy 14 66 GCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAA 1525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAA 24 0 

Qy 1526 AGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAAACCTGTATTGCCTCCA 1585 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M 
Db 241 AGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAAACCTGTATTGCCTCCA 300 

Qy 1586 GAGACCCAT ATTGT GGATGGATAAAGGAAGGT GGTGC CT GCAGCCATTTAT CACCCAACA 1645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 301 GAGACCCAT ATTGTGGATGGATAAAGGAAGGTGGTGCCTGCAGCCATTTATCACCCAACA 360 

Qy 1646 GCAGACT GACTTTT GAGCAGGACATAGAGCGTGGCAAT ACAGAT GGT CTGGGGGACT GT C 1705 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GCAGACT GACTTTT GAGCAGGACATAGAGCGTGGCAAT ACAGAT GGT CTGGGGGACT GT C 420 

Qy 1706 ACAAT T C CT T T GT GGCACT GAAT GGGC AT T C C AGT TCCCTCTTGCC CAGCACAAC CAC AT 1765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 421 ACAATTCCTTTGTGGCACTGAATGGGCATTCCAGTTCCCTCTTGCCCAGCACAACCACAT 480 



Qy 



17 66 CAGAT T C GAC GGCT CAAGAGGGGT AT GAGT CT AG G GGAGGAAT GCT GGACT G GAAG CAT C 182 5 



Db 



540 



Qy 1826 T G CTT GACT C AC CT GACAG CACAGAC C CT T T G GG GG CAGT GT CTT CCCAT AAT C AC C AAG 1885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 541 T GCTT GACT CAC CT GACAGC ACAGAC C CT T T G GGG GCAGT GT CT T C C CAT AAT CAC CAAG 600 

Qy 18 86 ACAAGAAGG GAGT GAT T CGGGAAAGT TAC CT CAAAGG CCAC GAC C AGCT GGT T C C C GT CA 1945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | M I I I I I I I I I 
Db 601 ACAAGAAGGGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCA 660 

Qy 194 6 CCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCA 2005 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 661 CCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCA 720 

Qy 2 006 CCGTCTACTGCGTCTGTGATCATCGGCGCAAAGA-CGTGGCTGTGGTGCAG-CGCAAGGA 2 063 

I I I I I I I I I I I I II I M I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACCGTGGCTGTGGTGCANCCGCAAGGA 780 

Qy 2 064 GAAGGAGCT CAC C CACT - CGCGCCGGGGCTC CAT GAG -CAGCGT CAC CAAG CTCAGCGGC 2121 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AAAAGAGCTCACCCACTCCGCGCGGGGGCTTCATGAGCCAGCGTCACCAAGCTTCACCGG 840 

Qy 2122 CTCTTT 2127 

I I I I 

Db 841 CCCTCT 846 



RESULT 12 

BU172225 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BU172225 883 bp mRNA linear EST 04-SEP-2002 

AGENCOURT_7962341 NIH_MGC_112 Homo sapiens cDNA clone IMAGE : 6106551 
5 1 , mRNA sequence. 
BU172225 

BU172225.1 GI:22686209 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 883) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: DCTD/DTP 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at: 

http : //image . llnl . gov 

Plate: LLCM2347 row: m column: 16 

High quality sequence stop: 606. 
Location/Qualifiers 
1. .883 



/organism="Homo sapiens" 
/mol_type= "mRNA" 
/db_xref="taxon: 9606" 
/clone=" IMAGE: 6106551" 

/tissue_type="melanotic melanoma, cell line" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib="NIH_MGC_112" 

/note="Organ: skin; Vector: pOTB7; Site_l: Xhol; Site_2: 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRl/XhoI sites using the following 5' adaptor: 
GGCACGAG(G). Library constructed by Ling Hong in the 
laboratory of Gerald M. Rubin (University of California, 
Berkeley) using ZAP-cDNA synthesis kit (Stratagene) and 
Superscript II RT (Life Technologies) . Note: this is a 
NIH MGC Library. " 



ORIGIN 



Query Match 25.0%; Score 772.4; DB 13; Length 883; 

Best Local Similarity 98.6%; Pred. No. 3.1e-172; 

Matches 779; Conservative 0; Mismatches 11; Indels 0; Gaps 0; 

Qy 1301 AT CACACT GTGGTTTTTCT GGGATC AGAGAAGGGAAT CAT CT T GAAGT TTTT GG C CAGAA 1360 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 AT T CCACT GTGGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CT T GAAGT TT T T GGC CAGAA 73 

Qy 1361 T AGGAAAT AGT GGT T T T CT AAAT GAC AGC CTTTTCCTG GAGGAGAT GAGT GT T T AC AACT 1420 

I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I 

Db 74 T AGGAAAT AGT GGTTTT CTAAAT GACAGCCTTTT C CTGGAGGAGATGAGT GTTTACAACT 133 

Qy 1421 CT GAAAAAT GCAGCTAT GAT GGAGT C GAAGACAAAAGGAT CAT GGGC AT GCAGCT GGACA 14 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 134 CT GAAAAAT GCAGC TAT GAT G GAGT C GAAGACAAAAGGAT CAT GGGC AT G C AGCT GGACA 193 

Qy 14 81 GAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCC 1540 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 194 GAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCC 253 

Qy 1541 GGT GT GAAC GAC AT GGGAAGT GT AAAAAAAC CT GT ATT GC CT C CAGAGAC C CAT ATT GT G 1600 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2 54 GGT GT GAAC GAC AT G G GAAGT GT AAAAAAAC CT GT AT T G C CT C CAGAGAC C CAT AT T GT G 313 

Qy 1601 GAT GGAT AAAGGAAGGT GGT GC CT GCAGC CAT TT AT CAC C CAAC AGCAGACT GACT T T T G 1660 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 314 GAT GGAT AAAGGAAGGT GGT GC CT G C AGC C AT TT AT CACC CAACAG C AGACT GACT T T T G 373 

Qy 1661 AGCAGGACATAGAGCGTGGCAATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGG 172 0 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 374 AGCAGGACATAGAGCGTGGCAATACAGAT GGT CTGGGG GACT GTCACAATTCCTTTGTGG 433 

Qy 1721 CACT GAAT GGGCAT T C C AGT TCCCTCTTGCC CAGC ACAAC CAC AT C AGAT T C GAC GGCT C 17 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 
Db 4 34 CACT GAAT GGGCAT T CC AGT TCCCTCTTGCC CAGC ACAAC CAC AT CAGAT T C GAC GGCT C 493 



Qy 

Db 



1781 
494 



1840 
553 



Qy 

Db 



1841 ACAGCACAGACCCTTT GGGGGCAGT GT CTT CC CATAAT CACCAAGACAAGAAGGGAGTGA 1900 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 

554 ACAGCACAGACCCTTT GGGGGCAGT GT CTT CCCATAATCACCAAGACAAGAAGGGAGT GA 613 



Qy 1901 TTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTG 19 60 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 614 TTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTG 673 

Qy 1961 CAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCT 2020 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 67 4 CAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCCGGCATCACCGCCTACTGCGTCC 733 

Qy 2 021 GT GAT CAT CGGC GCAAAGAC GT G GCT GT G GT G CAGC GCAAGGAGAAGGAGCT C AC C CACT 2080 

I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I III II I I I I I I I I I I I I I I I II II 
Db 734 GTGATCATCGGCGCAAAAACGTGGCTGTGGTGCCCCGCCAGGAGAAGGAGCTCACCCACT 793 

Qy 2 081 CGCGCCGGGG 2 090 

MM I III 
Db 794 CGCGGCCGGG 803 
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BQ440312 864 bp mRNA linear EST 24-MAY-2002 

AGENCOURT_7 9 02718 NIH_MGC_72 Homo sapiens cDNA clone IMAGE : 6157758 
5 ! , mRNA sequence. 
BQ440312 

BQ44 0312. 1 GI: 21179388 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 864) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: ATCC/DCTD/DTP 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : / / image . llnl . gov 

Plate: LLAM13504 row: c column: 07 

High quality sequence stop: 659. 
Location/Qualifiers 
1. .864 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 6157758" 
/tissue_type="melanotic melanoma" 
/lab_host="DH10B (phage-resistant ) " 
/clone lib="NIH MGC 72" 



/note="Organ: skin; Vector: pCMV-SP0RT6; Site_l: NotI; 
Site_2 : Sail; Cloned unidirectionally . Primer: Oligo dT . 
Average insert size 2 kb. Library constructed by Life 
Technologies . " 

ORIGIN 

Query Match 24.9%; Score 770; DB 13; Length 864; 

Best Local Similarity 96.3%; Pred. No. 1.2e-171; 

Matches 830; Conservative 0; Mismatches 24; Indels 8; Gaps 4; 

Qy 1596 T TGT GGAT G G AT AAAG GAAG GT GGT G C CTGCAGC CAT T TAT CAC C C AACAGCAGACT GAC 1655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 T TGT GGAT GGAT AAAGGAAG GT GGT G C CT GCAGC CAT T TAT CAC C CAACAGCAGACT GAC 60 

Qy 1656 TTTTGAGCAGGACATAGAGCGTGGCAATACAGATGGTCTGGGGGACTGTCACAATTCCTT 1715 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 T TT T GAG C AGGAC AT AGAGC GT GGCAAT ACAGAT GGT CT GGGGGACT GT CACAAT T C CTT 12 0 

Qy 1716 T GT G GCAC T GAAT GGGC AT T C CAGT TCCCTCTTGCC C AGC ACAAC CACAT C AGAT T C GAC 1775 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 121 T GT GGCACT GAAT GGGCAT T C CAGT T CCCTCTTGCC C AGCACAAC CACAT C AG AT T C GAC 18 0 

Qy 1776 GGCTCAAGAGGGGTATGAGTCTAGGGGAGGAATGCTGGACTGGAAGCATCTGCTTGACTC 1835 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I ! I I I I I I M I I I I I I I I I I 

Db 181 GGCT CAAGAGGGGT AT GAGT CTAGGGGAGGAATGCT GGACT GGAAGCAT CTGCTT GACT C 24 0 

Qy 1836 AC CT GAC AG CACAGAC CCTTTGGGGG CAGT GTCT T C C CAT AAT CAC CAAGACAAGAAG GG 18 95 

I I I M I I I I I I I I I I I I I II I I M I I I II I I I I I I I I M I I I I II I I I I I I I I I I I I I I I 
Db 241 AC CT GAC AGCACAGAC CCTTTGGGGG CAGT GTCT T C C CAT AAT CAC CAAGACAAGAAG GG 300 

Qy 18 96 AGT GAT T C GG GAAAGT TAC CT CAAAG GCCAC GAC CAGC T GGTT C C C GT CAC CCT C TT GGC 1955 

I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 301 AGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGC 360 

Qy 1956 CATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTG 2015 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I 

Db 361 CATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTG 420 

Qy 2016 CGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCAC 2075 

II II I ! I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 C GT CT GT GAT CAT C GG C GCAAAGACGT GGCT GT GGT GCAGC GCAAGGAGAAGGAG CT CAC 480 

Qy 2 076 CCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACAC 2135 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 4 81 CCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACAC 54 0 

Qy 2136 T CAATC CAAAGAC C CAAAGC C GGAGGC CAT C CT CAC G C C ACT CAT GCAC AACGGCAAG CT 2195 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 541 T CAAT C CAAAGAC C CAAAGC C GGAGG C CAT C CT CAC G C C ACTC AT GC ACAACGGCAAGCT 60 0 

Qy 2196 CGC CACT CC C GGCAAC ACGGCCAAGAT GCT CAT T AAAGC AGACCAGCAC C ACCT GGAC CT 2255 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGCCACT CC CGGCAACACGGCCAAGATGCT CATTAAAGCAGACCAGCACCACCT GGAC CT 660 



Qy 2256 GAC GGC C CT C CC C AC C C CAGAGT CAAC CC CAAC G CT GCAG CAGAAGC GGAAGC C CAG C C G 2315 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I 
Db 661 GAC GG C C CT C CC C AC C C CAGAGT CAAC CC CAACG CT GCAG CAGAAGC GGAAGC C CAG C C G 72 0 



Qy 
Db 



2316 CGGCAGC CGC G- AGT GGGAGAGGAAC CA- GAAC C T CAT C AAT GC CT GCACAAAG GACAT G 2373 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II M I I I I I I III I'l ITT 
721 CGG CAAC CGC GAAGTG G GAGAAGAAC CANNAAC CT C AT C AAT GC CT G CACAAAGGACAT G 78 0 



Qy 2374 CCCCCCATGGG — CTCCCCTGTGATTCCCACGGACCTG CCCCTGCGGGCCTCCCCC 2427 

I I I I I I M I I I III I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 781 CCCCCCATGGGGCTCCCCTGNTGATTTCCACGGACCCGTGCCCCTGNCGGGGCCTCCCCC 84 0 

Qy 2 428 AGCCACATCCCCAGCGTGGTGG 244 9 

III I I I I I I I I I I 
Db 841 AGCACAATCNCCCCCAAGGGGG 8 62 
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BU838082 
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BU838082 874 bp mRNA linear EST 16-OCT-2002 

AGENCOURT_8071571 NIH_MGC_112 Homo sapiens cDNA clone IMAGE : 6088226 
5', mRNA sequence. 
BU838082 

BU838 082. 1 GI : 24022477 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 874) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: DCTD/DTP 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLCM232 6 row: b column: 03 

High quality sequence stop: 652. 
Location/Qualifiers 
1. .874 

/organism-"Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="IMAGE: 6088226" 

/tissue_type="melanotic melanoma, cell line" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib="NIH_MGC_112" 

/note="0rgan: skin; Vector: pOTB7 ; Site_l: Xhol; Site__2: 
EcoRI ; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRI/XhoI sites using the following 5' adaptor: 
GGCACGAG ( G ) . Library constructed by Ling Hong in the 
laboratory of Gerald M. Rubin (University of California, 
Berkeley) using ZAP-cDNA synthesis kit (Stratagene) and 
Superscript II RT (Life Technologies) . Note: this is a 



ORIGIN 



NIHJVIGC Library." 



Query Match 24.8%; Score 767.4; DB 13; Length 874; 

Best Local Similarity 99.2%; Pred. No. 4.8e-171; 

Matches 771; Conservative 0; Mismatches 6; Indels 0; Gaps 0; 

Qy 1286 CT GGGCCATATCAGAAT CACACTGT GGTTTTT CT GGGAT CAGAGAAGGGAATCAT CTT GA 1345 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CT GGGCCATAT CAGAAT CACACTGT GGTTTTT CT GGGAT CAGAGAAGGGAAT CAT CTT GA 60 

Qy 134 6 AGTTTTT GGCCAGAATAGGAAATAGTGGTTTT CTAAAT GACAGC CTTTT CCT GGAGGAGA 1405 

I M I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I M I I I I > I I I I I I I M I I I I I I I I I I I I 

Db 61 AGTTT TT GGC CAGAAT AGGAAATAGT G GT TT T CTAAAT GAC AGC CT T T T CCT GGAGGAGA 120 

Qy 14 06 T GAGT GT T TACAACT CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GG 1465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 121 T GAGT GT T TACAACT CT GAAAAAT G C AGCT AT GAT GGAGT CGAAGACAAAAGGAT CAT GG 180 

Qy 14 66 GCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATT^A 1525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAA 240 

Qy 1526 AGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAAACCTGTATTGCCTCCA 1585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 241 AGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAAACCTGTATTGCCTCCA 300 

Qy 158 6 GAGACCCATATT GT GGAT GGATAAAGGAAGGT GGT GC CTGCAGCCATTTAT CACCCAACA 1645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GAGAC CC ATATTGT GGAT GGATAAAGGAAGGT GGT GCCTGCAGCCATTTAT CACCCAACA 360 

Qy 1646 GCAGACT GACT T T T GAGC AGGAC AT AGAGC GT GGCAAT AC AGAT GGT CT GGGGGACT GT C 1705 

I I I I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GCAGACT GACTTTT GAG CAGGAC AT AGAGC GT GGCAAT AC AGAT GGT CT GGGGGACT GT C 420 

Qy 17 06 ACAATTCCTTTGTGGCACTGAATGGGCATTCCAGTTCCCTCTTGCCCAGCACAACCACAT 1765 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AC AAT TCCTTTGTGG C ACT GAAT GGGCATT C CAGT TCCCTCTTGCC C AGCACAAC CACAT 4 80 

Qy 17 66 CAGAT T C GAC G GCT CAAGAGGGGT AT GAGT CT AGGGGAGGAAT GCT GGACT GGAAGCAT C 1825 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CAGAT T C GAC GGCT CAAGAGGGGT AT GAGT CT AG G GGAGGAAT GCT GGACT GGAAGCAT C 540 

Qy 1826 T GC T T GACT C ACCT GAC AGC ACAGAC C CTT T GGGG GCAGT GT CT T CC CATAAT C AC CAAG 1885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 541 TGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCTTCCCATAATCACCAAG 600 

Qy 18 86 ACAAGAAGGGAGT GAT T C G G GAAAGT T ACCT CAAAGGC CAC GAC CAGCT GGT T C C CGT CA 1945 

I I I I I I I I II I I I I I I I I I I I I I I I I I II I II I I I I I I I I II I I I II I I I I II I I I I I I I 
Db 601 ACAAGAAGG GAGT GAT T C GGGAAAGT T AC CT CAAAGGC CAC GAC CAGC TG GT T C C C GT C A 660 

Qy 1946 CCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCA 2005 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGAGGGCCGTCTTCTCGGGCATCA 720 

Qy 2 006 CCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGG 2062 

I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I III I I 



Db 721 CCGTCTACTGCGTCTGTGATCATCGGCGCCAAGACGTGGCTGTGGTGCCACGCCAAG 777 
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BQ683009 890 bp mRNA linear EST 15-JUL-2002 

AGENCOURT_8208 014 NIH_MGC_112 Homo sapiens cDNA clone IMAGE : 6262587 
5', mRNA sequence. 
BQ683009 

BQ683009. 1 GI : 2179568 8 
EST . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 890) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: DCTD/DTP 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / / image . llnl . gov 
Plate: LLCM2425 row: c column: 04 
High quality sequence stop: 621. 
Location/Qualifiers 
1. .890 

/organism-"Homo sapiens" 
/mol_type= "mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 6262587" 

/tissue_type="melanotic melanoma, cell line" 
/lab__host="DH10B (phage-resis tant ) " 
/clone_lib="NIH_MGC_112" 

/note="0rgan: skin; Vector: pOTB7 ; Site_l: Xhol; Site_2: 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRI/XhoI sites using the following 5 1 adaptor: 
GGCACGAG ( G) . Library constructed by Ling Hong in the 
laboratory of Gerald M. Rubin (University of California, 
Berkeley) using ZAP-cDNA synthesis kit (Stratagene) and 
Superscript II RT (Life Technologies) . Note: this is a 
NIH_MGC Library. " 



ORIGIN 



Query Match 24.6%; Score 760.6; DB 13; Length 890; 

Best Local Similarity 97.0%; Pred. No. 2e-169; 

Matches 808; Conservative 0; Mismatches 19; Indels 6; Gaps 3; 

Qy 1286 CT GG GCC ATAT C AGAAT C AC ACT GT GGTTTTTCT GGGAT CAGAGAAGG GAAT CAT CT T GA 1345 

I I I I I I I I I I I I I I I I I ! I I I I I I I II I I I I II I I I I I I I I I I I I I I I II I I I M I I I I I 
Db 1 CT G GGC CAT AT C AGAAT C AC ACT GT GGTTTTTCT GGGAT CAGAGAAG GGAAT C AT CT T GA 60 



Qy 134 6 AGT T T T T GGC CAGAAT AGGAAAT AGT GGTT T T CTAAAT GAC AG CCTTTTCCT GGAGGAGA 1405 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I I > I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 61 AGT T T T T G GC CAGAAT AGGAAAT AGT G GTT TT CTAAAT GAC AGC CTTT T C CT GGAGGAGA 120 

Qy 1406 T GAGT GT T T ACAACT CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GG 14 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 121 T GAGT GT T T ACAACT CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAG GAT CAT GG 180 

Qy 14 66 GCAT GCAGCT GGACAGAGCAAGCAGCT CTCT GTAT GTT GCGTT CT CTACCT GT GT GATAA 152 5 

I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GCAT GCAGCT GGACAGAGCAAGCAGCT CTCT GTAT GTT GCGTT CT CTACCT GT GT GATAA 240 

Qy 1526 AGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAAACCTGTATTGCCTCCA 1585 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I I 
Db 241 AGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAAACCTGTATTGCCTCCA 300 

Qy 1586 GAGACC C AT AT T GT GGAT GGAT AAAGGAAGGT GGT GC CT GC AGC CATT T AT CAC C CAACA 1645 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 301 GAGACC CAT AT T GT GGAT G GAT AAAGGAAGGT GGT GC CT GC AGCCAT T TAT CAC C CAACA 360 

Qy 164 6 GCAGACT GACTTTT GAGCAGGACATAGAGCGTGGCAATACAGAT GGT CTGGGGGACTGTC 17 05 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II 
Db 361 G C AGACT GACT TTT GAGCAGGACAT AGAGC GT GGCAATAC AGAT GGT CT GGGGGACT GT C 42 0 

Qy 17 06 ACAATT C CT T T GT GGC ACT GAAT GGGC AT T CCAGT T C C CT CTT GCC CAGC ACAAC CAC AT 17 65 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 421 ACAATT C CTT T GT GGC ACT GAAT G GGC AT T C CAGT T C C CT CTT G CC CAGC ACAAC CACAT 48 0 

Qy 1766 CAGATT C GACGGCT CAAGAGGGGTATGAGT CTAGGGGAGGAAT GCT GGACT GGAAGCATC 182 5 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 481 CAGATTCGACGGCT CAAGAGGGGTAT GAGT CTAGGGGAGGAAT GCT GGACT GGAAGCATC 54 0 

Qy 1826 T GCT T GACT CAC CTGACAGCACAGACCCTTTGGGGGCAGTGTCTTCCCATAAT CAC CAAG 18 85 

I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TGCT T GACT C AC CT GACAGCAC AGAC C CT T T GGGGGC AGT GT C T T C C CATAAT CAC CAAG 600 

Qy 1886 ACAAGAAGGGAGT GAT T CGGGAAAGT T AC CT CAAAGGCCAC GAC CAGCT GGTT C C C GT C A 194 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ACAAGAAGGGAGT GAT T CG GGAAAGT T AC CT CAAAGG CCAC GAC CAGCT GGTT C C C GT C A 660 

Qy 1946 CCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCA 2005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCCTCTTCTCCGGCATCA 72 0 

Qy 2 006 CCGTCTACTGCGTCTGTGATCATCGGCGCAAAG-ACGTGGCTGTGGTGCAGCGCAAGG — 2062 

I I I I I I I ! I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I III I I I I I II 

Db 721 CCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAACGTGGCTGTGGGGCACCGCAAGGGA 7 80 

Qy 2 063 — AGAAGGAGCTCACCCACTCGCGCCGGGGCTCCA-TGAGCAGCGT CAC CAAG 2112 

I I I I III III I M I I I I I I I I I I I I I I M I I I I II 
Db 781 GAAGGAG CTT CAC CC AT T C C CGGCC GGGGGCT C CAT T GAGAG GC GT CAC CAAG 833 



Search completed: March 26, 2004, 06:35:37 
Job time : 8396.21 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 

Run on: March 25, 2004, 21:56:51 ; Search time 12300 Seconds 

(without alignments) 

10899.164 Million cell updates/sec 

Title: US-09-856-681A-1 
Perfect score: 3093 

Sequence: 1 atgaggtcagaagccttgct ccaatgatgcgtgtacataa 3093 

Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 3470272 seqs, 21671516995 residues 

Total number of hits satisfying chosen parameters: 6940544 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : GenEmbl : * 

1: gb ba:* 



2 : gb_htg : * 
3 : gb_in : * 
4: gb_om:* 
5 : gb_o v : * 
6: gb_pat:* 
7 : gb_ph : * 
8 : gb_pl : * 
9: gb_pr:* 
10: gb_ro:* 
11: gb_sts:* 
12: gb_sy:* 
13: gb_un:* 
14: gb_vi:* 
15: em_ba:* 
16 : em fun : * 
17: em_hum: * 
18: em_in:* 
1 9 : em_mu : * 
2 0 : em_om : * 
21: em_or:* 
2 2 : em_ov : * 
23: em_pat:* 
24: em_ph:* 
25: em_pl:* 
26: em_ro : * 
27 : em sts : * 



28 


em 


un: * 


29 


em 


vi : * 


30 


em 


htg hum:* 


31 


em 


htg inv:* 


32 


em 


htg other:* 


33 


em 


htg_mus : * 


34 


em 


htg pin:* 


35 


em 


htg rod:* 


36 


em 


htg_mam: * 


37 


em 


htg vrt:* 


38 


em 


sy: * 


39 


em 


htgo hum:* 


40 


em 


htgo mus : * 


41 


: em_ 


htgo other: 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 



[o. 


Score 


Match Length 


DB 


ID 


Description 


1 


3093 


100 . 


0 


3093 


6 


AX026741 


AX026741 


Sequence 


2 


3093 


100 . 


0 


3862 


6 


AX026746 


AX026746 


Sequence 


3 


3093 


100 . 


0 


o o a o 


9 


AF279656 


AF279656 


Homo sapi 


4 


3038 


98 . 


z 


y o 


6 


BD274938 


BD274938 


POLYNUCLE 


5 


3032 




0 


4250 


9 


AB037789 


AB037789 


Homo sapi 


6 


2975 


96. 


2 


4982 


6 


AX780545 


AX780545 


Sequence 


7 


2969.6 


96. 


0 


6060 


6 


AX884099 


AX884099 


Sequence 


8 


2969.6 


96. 


0 


6060 


6 


BD160721 


' BD160721 


Primer fo 


9 


2969.6 


96. 


0 


6060 


9 


AK027867 


AK027867 


Homo sapi 


10 


2746.2 


88. 


8 


3550 


6 


AX099520 


AX099520 


Sequence 


11 


2746.2 


88. 


8 


3550 


6 


BD190797 


BD190797 


Secreted 


12 


2698 


87. 


2 


3333 


6 


BD274939 


BD274939 


POLYNUCLE 


13 


2584 


83. 


5 


4702 


10 


BC059238 


BC059238 


Mus muscu 


14 


2414.8 


78. 


1 


3018 


10 


AF288666 


AF2 8 8666 Mus muscu 


15 


2282.4 


73. 


8 


4139 


10 


BC062979 


BC06297S 


Mus muscu 


16 


2182.4 


70. 


6 


3041 


6 


AX882248 


AX882248 


Sequence 


17 


2182.4 


70. 


6 


3041 


6 


BD159617 


BD159617 


Primer fo 


18 


2182.4 


70. 


6 


3041 


9 


AK027501 


AK027501 


Homo sapi 


19 


2137.4 


69. 


1 


2770 


10 


AF030430 


AF030430 Mus muscu 


20 


1881.6 


60. 


8 


1890 


6 


BD274951 


BD274951 


POLYNUCLE 


21 


1824.4 


59. 


0 


2293 


6 


AX879422 


AX879422 


Sequence 


22 


1824.4 


59. 


0 


2293 


6 


BD157826 


BD157826 


Primer fo 


23 


1824.4 


59. 


0 


2293 


9 


AK027471 


AK027471 


Homo sapi 


24 


1742.4 


56. 


3 


2227 


6 


BD127394 


BD127394 


Primer fo 


25 


1742.4 


56. 


3 


2227 


9 


AK074975 


AK074975 


Homo sapi 


26 


1666.4 


53. 


9 


2306 


6 


AX882662 


AX882662 


Sequence 


27 


1666.4 


53. 


9 


2306 


6 


BD159853 


BD159853 


Primer fo 


28 


1666.4 


53. 


9 


2306 


9 


AK027654 


AK027654 


Homo sapi 


29 


1462 


47. 


3 


2123 


6 


AX876167 


AX876167 


Sequence 


30 


1462 


47. 


3 


2123 


6 


BD155987 


BD155987 


Primer fo 


31 


1462 


47. 


3 


2123 


9 


AK027439 


AK027439 


Homo sapi 


32 


1367.2 


44. 


2 


3634 


9 


AK096337 


AK096337 


Homo sapi 


33 


1200 


38. 


8 131823 


2 


AC010497 


AC010497 


Homo sapi 



c 


34 


1200 


38. 


8 


134349 


9 


AC010296 


AC0102 96 Homo sapi 




35 


1200 


38. 


8 


154061 


9 


AC008524 


AC008524 Homo sapi 




36 


1200 


38. 


8 


179647 


2 


AC108124 


AC108124 Homo sapi 


c 


37 


1200 


38. 


8 


188207 


2 


AC010233 


AC010233 Homo sapi 




38 


1122 


36. 


3 


4350 


5 


BC061707 


BC061707 Danio rer 




39 


1023.8 


33. 


1 


169529 


10 


AC124466 


AC124466 Mus muscu 


c 


40 


1023.8 


33. 


1 


170386 


2 


AC124181 


AC124181 Mus muscu 




41 


1023. 8 


33. 


1 


184366 


10 


AC121783 


AC121783 Mus muscu 




42 


1023. 8 


33. 


1 


237974 


2 


AC094771 


AC094771 Rattus no 


c 


43 


1023.8 


33. 


1 


253924 


2 


AC126707 


AC126707 Rattus no 




44 


1023.8 


33. 


1 


258786 


2 


AC125773 


AC125773 Rattus no 




45 


788 


25. 


5 


839 


6 


AX867332 


AX867332 Sequence 



ALIGNMENTS 



RESULT 1 
AX026741 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 



JOURNAL 



FEATURES 

source 



AX026741 3093 bp 

Sequence 1 from Patent WO0031252. 
AX026741 

AX0267 41. 1 GI : 10187 8 86 



( human ) 



CDS 



DNA 



linear 



PAT 16-SEP-2000 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Klostermann, A. and Behl,C. 

Human semaphorin 6a- 1 (sema6a-a) , a gene involved in neuronal 
development and regeneration mechanisms during apoptosis, and its 
use as a potential drug target 
Patent: WO 0031252-A 1 02-JUN-2000; 

KLOSTERMANN ANDREAS (DE) ; MAX PLANCK GESELLSCHAFT (DE) ; BEHL 
CHRISTIAN (DE) 

Location/Qualifiers 

1. .3093 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
1. .3093 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id="CAC09107 . 1" 
/db_xref="GI: 10187887" 
/ db_x r e f = " REMT REMBL : CAC 09107" 

/ translation="MRSEALLLYFTLLHFAGAGFPEDSEPISISHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNGTLYIAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDALFVCGTNAFNPSCRNYKMDTLEPFGDEFS 
GMARCPYDAKHANVALFADGKLYSATVTDFLAI DAVI YRSLGESPTLRTVKHDSKWLK 
E P Y FVQAVD YGD Y I Y F F FRE I AVE YNTMGKWFP RVAQVC KNDMG G S Q RVLE KQWT S F 
LKARLNC S VP G D S H FY FN I LQ AVT DVI RING RD WLAT F S T P YN S I P G S AVCAYDML D 
IASVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLERYATSNEFPDDTLNFI 
KTHPLMDEAVPS I FNRPWFLRTMVRYRLTKI AVDTAAGP YQNHTWFLGS EKGI I LKF 
LARIGNSGFLNDSLFLEEMSVYNSEKCSYDGVEDKRIMGMQLDRASSSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWIKEGGACSHLSPNSRLTFEQDIERGNTDGLG 



DCHNSFVALNGHSSSLLPSTTTSDSTAQEGYESRGGMLDWKHLLDSPDSTDPLGAVSS 
HNHQDKKGVIRESYLKGHDQLVPVTLLAIAVILAFVMGAVFSGITVYCVCDHRRKDVA 
WQRKEKELTHSRRGSMSSVTKLSGLFGDTQSKDPKPEAI LTPLMHNGKLATPGNTAK 
MLIKADQHHLDLTALPTPESTPTLQQKRKPSRGSREWERNQNLINACTKDMPPMGSPV 
IPTDLPLRASPSHIPSVWLPITQQGYQHEYVDQPKMSEVAQMALEDQAATLEYKTIK 
EHLSSKSPNHGVNLVENLDSLPPKVPQREASLGPPGASLSQTGLSKRLEMHHSSSYGV 
DYKRSYPTNSLTRSHQATTLKRNNTNSSNSSHLSRNQSFGRGDNPPPAPQRVDSIQVH 
SSQPSGQAVTVSRQPSLNAYNSLTRSGLKRTPSLKPDVPPKPSFAPLSTSMKPNDACT 
m 

ORIGIN 



Query 


Match 


100.0%; Score 3093; DB 6; Length 3093; 




Best 


Local Similarity 100. 0%; Pred. No. 0; 




Matches 3093; Conservative 0; Mismatches 0; Indels 0; Gaps 


0; 


Qy 


1 


ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 


60 




i i i i i i i i i i i i i i i i i i i i i i i i i i t t i i i i i i i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I I 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 M 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 I I 




Db 


1 


ATGAGGTCAGAAGCCI 1 GC1 GC i Al Ai 1 1 brU 1 AL.au ill i (j^^jVjO i lit 


60 


Qy 


61 


C CAGAAGATT CTGAGCCAAT CAGT ATTT CGCATGGCAACTATACAAAACAGTAT CCGGTG 


120 




i i i i i i i i i i i i i i i i i t i i i i i i i i i i I i i i i i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
M I M 1 II II 1 1 1 1 II 1 1 1 1 1 1 M 1 M 1 II II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 




Db 


61 


CCAGAAGATTCTGAGCCAAI CAGl Al 1 1 LbLAl bbLAAU i Al ALAAAALAb 1 Al ^Ubb 1 b 


120 


Qy 


121 


TTT GTGGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGATG 


180 




i i i i i t i i i i i t i i i i i i i i i i i i t i i i i i i i i i I I I i I l l l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 
M | | | | | | | | 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


121 


mmm /~>m/~* /~> r-< r** r*-i\ r* t\ T\r^r^r*T\rT , 7\r*rT*7\ Ar*A/^r^Ai^Ar , Ar*A/~r*PAr < Af^r i r'T("'f r IAr i ATr'r , Af^ATf^ 

TTTGTGGGCCACAAGCLAGGALGGAALAUUACAUA^ |jo/\lj-\.i lla^ai ^ 


180 


Qy 


181 


ATTATGAT CATGAACGGAACCCT CTACATTGCTGCTAGGGACCATATTTATACT GTT GAT 


240 




i i i i i t i i t i i i i i i i i i i i i i t i i i i i t t i i I I I I I I I I I I l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I 1 M 1 M 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 If 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 1 1 t I I I I I I 




Db 


181 


ATTAlGAl LAI (jAAL,br(jAAL.b.L-l L-1 ALA1 1 IcrL- 1 Lrt l/\kjL?lj/\L-V_,/\li-\.l 1 lAIA^lUl -L 


240 


Qy 


241 


ATAGACACATCACACACGGAAGAAATTTATTGTAGCAAAAAACTGACATGGAAATCTAGA 


300 




i i i i i i i i i i i i i I i i i i i i I I I I I I I I I I 1 It 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 
| I 1 [ | 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 J 1 M 1 1 1 1 1 1 i 1 1 f 1 1 1 1 1 1 1 I l l l l i i i i i 




Db 


z4I 


7\rrAr7\r , 7\r7\ f pr , 7\ri\rBrr'riiar2iZi A TTT ATTfT "hCC A A A A A AfTHAP ATnnAAATPTAGA 
J\i AbrAb-AUAi LALAUALbbAAuAnrVl 1 1/\1 1 \j 1 J\\^^I\t-\r\j-\s\t\^ i ^>f\^r\ l uu/wai ^ ino/i 


300 


Qy 


301 


CAGGC C GAT GT AGACACAT G CAGAAT GAAGGGAAAAC AT AAGGAT GAGT G C CACAACT TT 


360 




1 1 1 1 1 1 1 1 1 i I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 M 1 I 1 1 




Db 


301 


CAGGC C GAT GTAGACACAT GC AGAAT GAAGGGAAAAC AT AAGGAT GAGT GC CACAAC TTT 


360 


Qy 


361 


ATTAAAGTT CTT CTAAAGAAAAACGAT GAT GCATTGTTT GT CT GTGGAACTAAT GCCTT C 


420 




I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


361 


AT T AAAGTT CTT CT AAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGAACT AAT GCCTT C 


420 


Qy 


421 


AAC CCT T CCT GC AGAAACT AT AAGAT GGATACAT T G GAAC CAT T C GG GGAT GAATT CAGC 


480 




I I M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 




Db 


421 


AAC C CT T C CT GCAGAAACT AT AAGAT GGATACAT T GGAAC CAT T C GGGGAT GAATT CAGC 


480 


Qy 


481 


GGAAT GGC CAGAT GC C CAT AT GAT GC CAAACAT GC CAAC GTT GCACT GT T T GCAGAT GGA 


540 




1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 




Db 


481 


G G AAT GGC CAGAT G C C CAT AT GAT G C CAAACAT G C CAAC G T T G C ACT GT T T G CAGAT G G A 


540 


Qy 


541 


AAACT ATACT CAGCCACAGT GACTGACTT CCTT GC CATT GACGCAGT CATTTACCGGAGT 


600 




| | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


541 


AAACT AT ACTCAGCCACAGT GACT GACTT C CTTGC CATT GACGCAGT CATTTACCGGAGT 


600 


Qy 


601 


CTT GGAGAAAG C C CT ACC CT GC GGAC C GT C AAGCAC GATT CAAAAT G GT T GAAAGAAC CA 


660 



I I 1 I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I 



Db 


b U 1 




\J\J ±- 


Db 


obi 


Qy 




Db 


TOT 
/Z 1 


Qy 


7 £11 


Db 


TOT 
/ 0 1 


Qy 


O *i 1 


Db 


841 


Qy 


Q ft 1 

y ui 


Db 


901 


Qy 


y bi 


Db 


961 


Qy 


lUzl 


Db 


1021 


Qy 


i fipi 


Db 


lUol 


Qy 


1 1 A 1 
1141 


Db 


1141 


Qy 


IzU 1 


Db 


1201 


Qy 


19 61 
1 Z O 1 


Db 


lzol 


Qy 


1 091 
loZ 1 


Db 


TOOT 

loz 1 


Qy 


1 ^ ft 1 


Db 


1381 


Qy 


1441 


Db 


1441 



601 CT T G GAGAAAGC C CT AC C CT GC G GACC GT CAAGC ACGAT T CAAAAT GGT T GAAAGAAC CA 660 
T ACT T T GT TCAAG C C GT GGATT AC G GAGAT TAT AT CT ACT T CT T CTT C AG GGAAAT AGCA 720 

I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I 

T ACT T T GT T CAAGC C GT G GAT T AC GGAGAT TAT AT CT ACT T CT T CTT CAGGGAAAT AGCA 720 

GT GGAGT ATAACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT GGCT CAGGTT T GT AAGAAT 780 

I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

GT GGAGT AT AACAC CAT GGGAAAG GTAGTT T T C C CAAGAGT GGCT CAGGT T T GTAAGAAT 7 80 

GAT AT GGGAG GAT CT CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GTT C CT GAAGGCG C GC 840 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAT AT GGGAGGAT CT CAAAGAGT C CTGGAGAAAC AGT GGAC GT C GTT C CT GAAG G CGC GC 840 

T T GAACT G CT C AGT TC CT G GAGACT CT CAT T T T T AT TT CAACATT CT C CAG GCAGTT ACA 900 

M I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I M I I I I I I I I 
TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

GAT GT GAT T C GTAT CAACG G GCGT GAT GTT GT C CT GGCAAC GT T TT CT AC ACCT T ATAAC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I || I I I I I I I I I II I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCAT C C CT GGGT CTGCAGT CT GT GC CTAT GAC AT GCT T GAC AT T GC CAGT GT T T T TACT 102 0 

GGGAGATTCAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT CCT GATGAACGA 1080 
I I M I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I II I I II I I I I I I I I I I I I I II I I I 
GGGAGATTCAAGGAACAGAAGTCTCCTGATTCCACCTGGACACCAGTTCCTGATGAACGA 108 0 

GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 
I I I I I I M I II I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

T C CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAAGACGCAC CC GCT CAT GGAT GAG 12 00 
I I I I I I I I I I I I M I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
TCCAAT GAGTTCCCTGAT GATACCCT GAACTT CAT CAAGACGCACCCGCT CATGGAT GAG 12 00 

GC AGT G CC CT C CAT CT T CAAC AGGC CAT G GTT C CT GAGAACAAT GGT CAGAT AC C GC CT T 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

GC AGT GCC CT C C AT CT T CAAC AG GC CAT GGTT C CT GAGAACAAT GGT CAGAT AC C GC CTT 1260 

ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1320 

I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1320 

GGAT C AGAGAAGGGAAT CAT CT T GAAGT TT T T GG C CAGAAT AG GAAAT AGTGGTT T T CT A 1380 

I || I I I I I I I I I I I I I I i I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

GGAT C AGAGAAGGGAAT C AT CT T GAAGT T TT T GG C CAGAAT AGGAAAT AGT GGTT T T CT A 138 0 

AAT GACAGC CT T TT CCT GGAGGAGAT G AGT GT T T ACAACT CT GAAAAAT GCAGCT AT GAT 14 40 
i M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M 
AAT GACAGC CT T TT C CT GGAGGAGAT GAGTGT T T ACAACT CT GAAAAAT GCAGCT AT GAT 1440 

GGAGT C GAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GTAT 1500 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I 
GGAGT C GAAGACAAAAGGAT CAT GGGCAT GC AGC T GGACAGAGCAAG C AGCT CT C T GTAT 1500 



Qy 


1501 


GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I It 1 1 1 1 M 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | I | | I I 1 I I I I 1 1 1 I 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 I 1 1 1 1 1 1 1 1 ' 1 1 ■ 1 1 1 




Db 


1501 


GT T GC GT T CT CT AC CT GT GT GATAAAG GTTCCCCTTGGCCGGTGT GAACGACAT GGGAAG 


1560 


Qy 


1561 


T GT AAAAAAAC CT GT ATT GC CT C CAGAGAC C CAT ATT GT G GAT G GAT AAAGGAAGGT GGT 


1620 




1 11 1 1 i 1 II 1 1 1 ! 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1561 


T GT AAAAAAAC CT GTATT GCCT CCAGAGAC C CAT ATT GTGGATGGAT AAAGGAAGGT GGT 


1620 


Qy 


1621 


G CCT G C AGCC AT T TAT C ACC CAAC AGC AGACT GACTT T T GAGC AGGACAT AGAGC GT GGC 


1680 




1 M 1 1 1 1 1 M 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
M II II 1 II M 1 M II II 1 1 1 1 l M 1 1 N l l l l l ll l ll l M ll ll l i i M M i i i i i i i 




Db 


1621 


GCCT GC AG CCAT T TAT C AC C CAAC AGCAGACT GACTT T T GAGCAGGACAT AGAG C GT GGC 


1680 


Qy 


1681 


AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 I i 1 M 1 1 ! 1 1 1 1 1 1 It 1 II I i 1 1 1 

| 1 | | 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1681 


AAT ACAGAT GGTCT GGGGGACT GT CACAAT T CCT T T GT GG C ACT GAAT GGGCAT T CCAGT 


1740 


Qy 


1741 


TCCCTCTTGCC CAG CACAAC CAC AT CAGAT T CGAC G G CT CAAGAG GGGT AT GAGT CT AGG 


1800 




1 1 1 1 1 t 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 
1 1 1 1 1 1 1 1 l l l l l l l l l l l I I I I I i i i i ii i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


1741 


TCCCTCTTGCC CAGCAC AAC CAC AT CAGAT T CGAC GGCT CAAGAGGG GT AT GAGT CT AGG 


1800 


Qy 


1801 


GGAGGAAT GCT GGACT GGAAGCAT CT GCTT GACT CACCT GACAGC ACAGACC CTTT GGGG 


I860 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I 1 I I I I I i i i i i i i i i i i i i i i i i i i i i i 




Db 


1801 


GGAGGAAT GCT GGACT G GAAG CAT CT GCTT GACT CAC CT GACAG CAC AGAC CCT T T GGGG 


1860 


Qy 


1861 


GC AGT GT CT T C CCAT AAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGTTAC CT CAAA 


1920 




1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i l l l l l l l l l l l i i i i i 1 11 1 1 1 11 1 11 1 1 




Db 


1861 


GCAGT GT CT T C C CAT AAT CAC CAAGACAAGAAGGGAGT GAT T C G GGAAAGT T AC CT CAAA 


1920 


Qy 


1921 


GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 


1980 




I ll I I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I 1 1 1 1 M II 1 1 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l ll l l l l l I I I I i i i i i i i i i i i i i i i i i ii i 




Db 


1921 


GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 


1980 


Qy 


1981 


ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 


2040 




1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 E 1 1 1 1 1 

| I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I l M i i i 




Db 


1981 


ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 


2040 


Qy 


2041 


GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 


2100 




1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 M I 1 1 1 
1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 l l l 1 l l l l l m i i i i i i i i i i i 




Db 


2041 


GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 


2100 


Qy 


2101 


AGC GT CAC CAAG CT C AGC G G C CT CT T T G GG GACACT CAAT CCAAAGACC CAAAGCC GGAG 


2160 




1 1 M 1 1 1 1 1 1 1 II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 
1 1 I 1 1 1 l l l l l l ll l I l I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


2101 


AG C GT CAC CAAG CT C AGC GGC CT CT TT GGGGAC AC T CAAT C CAAAGAC C CAAAGC C G GAG 


2160 


Qy 


2161 


GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 


2220 




1 II 1 M 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i • i i i 1 1 1 1 1 ■ 1 ■ ■ • 1 




Db 


2161 


G C CAT C CT CAC GC CACT CAT GC ACAACG GCAAGCT C GC CACT C C C GG CAACAC GGC CAAG 


2220 


Qy 


2221 


AT G CT CAT T AAAGCAGAC CAGCAC CACCT GGACCT GAC GGCCCTCCC C AC CC C AGAGT C A 


2280 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 




Db 


2221 


AT GCT CAT T AAAG CAGAC CAGCAC CACCT GGAC CT GAC GGC C CT C C CC AC C C CAGAGT C A 


2280 


Qy 


2281 


ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 


2340 




| | | I I I I I I I I I 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 II 




Db 


2281 


AC CC CAAC G CT GCAGCAGAAGC GGAAG C CCAG C CGC GGC AGC C GC GAGT GGGAGAGGAAC 


2340 



Qy 2341 CAG?lACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 24 00 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II II I II 1 1 1 1 1 II I II 1 1 1 1 1 1 

Db 2341 CAGAAC CT C AT CAAT GC CT GC ACAAAGGAC AT G C CC C CC AT GGG CT C C C CT GT GAT T CC C 24 00 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

| M I I I I M I I I I I M I I I I I I I I II I I I II I II I I I I I I I I I I I II I I I I I I I I M I I I 

Db 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

Qy 2461 AC GCAGCAGGGCTAC C AGCAT GAGT AC GT GGAC CAGC CCAAAAT GAGCGAGGT GG C C C AG 2520 

M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I M I I I I 
Db 2461 AC GCAGCAG G GCT AC CAG CAT GAGT AC GT G GAC CAG C C CAAAAT GAGCGAGGT GG C C CAG 2520 

Qy 2521 AT GGCGCT GGAGGACCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACATCT CAGC 2580 

| | | | | | I M I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I 
Db 2521 AT GGCGCT GGAGGAC C AGGC C GC CACACT GGAGTATAAGACCAT CAAGGAAC AT CT CAGC 2580 

Qy 2581 AGCAAGAGT CC CAAC CAT G GG GT GAACCT T GT GGAGAAC CTGGAC AGC CT GC C CC C CAAA 2640 

| | M | | | | | | | | | | | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M II I I I I I I 
Db 2581 AGCAAGAGT CC CAAC CAT GGGGT GAACCTT GT GGAGAAC CT GGAC AGC CT GC C CC C CAAA 2 640 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

I I I I I I I I I II I I I I I I M I II I I I I I I I I I I I II I I II I I I I I I I I I M 

Db 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

| | I I I I I I I I I I I I I I I I I I M I I I I I M I II I I I II I I I I I I I I I I I I I I I I I I I I II I 
Db 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

Qy 27 61 C C CAC GAACT C GCT C AC GAGAAGC C AC CAGGC CAC CACT CT CAAAAGAAACAACACT AAC 2 820 

| | | | | | | | | | | II M I I I I I I I I I I I I I M I I M I I I I I I I II I I M II I II I I I II I M 
Db 27 61 C C CAC GAACT C G CT CAC GAGAAGC CAC CAGGC CAC CACT CT CAAAAGAAACAACACT AAC 282 0 

Qy 2821 T CCT C CAATT C CT CT CAC CT CT CC AGAAAC C AGAGCT T T GGCAGGGGAGACAAC C C GC C G 2880 

| M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I 
Db 2821 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 28 8 0 

Qy 28 81 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 294 0 

I I I I I I I II I I I I I I I I I I I I I M I II I I I I I I I I I I I I II II I I I I 

Db 2 8 81 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 294 0 

Qy 2 941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

| | | M | | | | I I I I I I I I I I I I I I II I I II II I I I I I I I I M I I I I I I I II 11 I I I 

Db 2 941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I I I I I I M I I I I II II M II I I I M I I I I II I II I M I I I I I I I I I I I I I I II I II II I I 

Db 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

Qy 3061 AC AT C C ATGAAG C C CAAT GAT GC GT GTACAT AA 3093 

I | | | | I II I I I I II I I II I I I I I I M I I I I I I I 
Db 3061 AC AT C CAT GAAG C C CAAT GAT GC GT GT ACAT AA 3093 
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AX026746 
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ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 



JOURNAL 



FEATURES 

source 



CDS 



AX026746 

AX026746.1 GI:10187890 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Klostermann, A. and Behl,C. 

Human semaphorin 6a-l (sema6a-a) , a gene involved in neuronal 
development and regeneration mechanisms during apoptosis, and its 
use as a potential drug target 
Patent: WO 0031252-A 6 02-JUN-2000; 

KLOSTERMANN ANDREAS (DE) ; MAX PLANCK GESELLSCHAFT (DE) ; BEHL 
CHRISTIAN (DE) 

Location/Qualifiers 

1. .3862 

/organism="Homo sapiens" 
/mol_type=" una s signed DNA" 
/db_xref="taxon: 9606" 
658. .3750 

/note="unnamed protein product" 

/codon_start=l 

/protein_id="CAC0 9109. 1" 

/db_xref="GI : 10187891" 

/ db_x r e f = " REMT REMBL : CAC 09109" 

/ trans lation-"MRSEALLLYFTLLHFAGAGFPEDSEPI SI SHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNGTLYIAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDALFVCGTNAFNPSCRNYKMDTLEPFGDEFS 
GMARCPYDAKHANVALFADGKLYSATVTDFLAI DAVIYRSLGESPTLRTVKHDSKWLK 
EPYFVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSF 
LKARLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDMLD 
IASVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLERYATSNEFPDDTLNFI 
KTHPLMDEAVPSIFNRPWFLRTMVRYRLTKIAVDTAAGPYQNHTWFLGSEKGIILKF 
LARIGNSGFLNDSLFLEEMSVYNSEKCSYDGVEDKRIMGMQLDRASSSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWIKEGGACSHLSPNSRLTFEQDIERGNTDGLG 
DCHNSFVALNGHSSSLLPSTTTSDSTAQEGYESRGGMLDWKHLLDSPDSTDPLGAVSS 
HNHQDKKGVI RESYLKGHDQLVPVTLLAIAVI LAFVMGAVFSGITVYCVCDHRRKDVA 
WQRKEKELTHSRRGSMSSVTKLSGLFGDTQSKDPKPEAI LTPLMHNGKLATPGNTAK 
MLIKADQHHLDLTALPTPESTPTLQQKRKPSRGSREWERNQNLINACTKDMPPMGSPV 
IPTDLPLRASPSHIPSWVLPITQQGYQHEYVDQPKMSEVAQMALEDQAATLEYKTIK 
EHLSSKSPNHGVNLVENLDSLPPKVPQREASLGPPGASLSQTGLSKRLEMHHSSSYGV 
DYKRSYPTNSLTRSHQATTLKRNNTNSSNSSHLSRNQSFGRGDNPPPAPQRVDSIQVH 
SSQPSGQAVTVSRQPSLNAYNSLTRSGLKRTPSLKPDVPPKPSFAPLSTSMKPNDACT 



ORIGIN 

Query Match 100.0%; Score 3093; DB 6; Length 3862; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3093; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



QY 



Db 



1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

M | | | | | | | | | I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I 

658 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 717 



QY 



61 C CAGAAGAT T CT GAGCCAAT C AGT AT T T C GC AT G GCAACT AT ACAAAACAGT AT C C GGT G 120 
| | | | | I | I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 



DD 


7 1 Q 
/ lO 


Qy 


1 91 


Db 


/ / O 


Qy 




Db 


o o o 


Qy 


9/11 
Z fl 1 


Db 


898 


Qy 




Db 


"jo 


Qy 




Db 


1018 


Qy 




Db 


1078 


Qy 


A Q 1 


Db 


1138 


Qy 




Db 


1 1 ft o 

liy o 


Qy 


uUl 


Db 


1258 


Qy 


bol 


Db 


1318 


Qy 


791 


Db 


1 D "~7 O 

13/8 


Qy 


7 1 


Db 


143 8 


Qy 


RAT 
O X 


Db 


1498 


Qy 


901 


Db 


1558 



718 CCAGAAGATT CTGAGCCAATCAGTATTT C GCAT GGCAACT ATACAAAAC AGTAT CC GGT G 777 
TT T GT G GGC C ACAAGCC AG GAC GGAACAC CAC ACAGAG GCACAGGCT GGAC AT C C AGAT G 18 0 

I I I I II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I M II 

T T T GT GGGCC ACAAGCC AGGACGGAACAC CACACAGAGGC ACAG GCT GGAC AT C C AGAT G 837 

ATTAT GAT CAT GAACGGAACCCTCTACATTGCTGCTAGGGACCATATTTATACTGTTGAT 24 0 

I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M 

ATTAT GAT CAT GAACGGAACCCTCTACATTGCT GCTAGGGACCATATTTATACTGTTGAT 897 

AT AGACACAT C ACACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT AGACACAT CAC ACAC GGAAGAAAT T TAT T GT AG CAAAAAACT GACAT GGAAAT C T AGA 957 

CAGGCCGAT GT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GC CACAACTT T 360 
| I I I I I M I I I I I I I I I I I I I I I I I I I M I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 
CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 1017 

ATT AAAGTT CTT CT AAAGAAAAACGAT GAT GCATT GTTTGT CT GT GGAACT AAT GCCTT C 42 0 

I I M M I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GT T T GT CT GT G GAACT AAT G C CT T C 1077 
AAC C CTT C CT G C AGAAACT AT AAGAT GGAT ACAT T G GAAC CAT T C GGGGAT GAAT T C AG C 4 80 

I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I 

AAC C CTT C CT GC AGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T C GGGGAT GAAT T C AGC 1137 

GGAAT GGC C AGAT G CC C ATAT GAT GC CAAACAT G C CAAC GT T G C ACT GT T TGCAGAT GGA 54 0 
I | | | | | | | I I I I I I I I I I I II I I I II I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I 
GGAAT GGC CAGAT GCC C AT AT GAT G C CAAACAT GC CAAC GT T GC ACT GT T T GC AGAT GGA 1197 

AAACTATACTCAGCCACAGT GACT GACTT CCTTGCCATT GACGCAGT CATTTAC CGGAGT 600 

I I I I I I I I I I I I II II I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I 

AAACT AT ACT CAG CC AC AGT GACT GACTT C CT T G C CAT T GAC GC AGT C AT TT AC CGGAGT 12 57 
CTT GGAGAAAG C C CT AC C CT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC C A 660 

i I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

CTT GGAGAAAG C C CT AC CCT GC GGAC C GT CAAGC AC GAT T CAAAAT GGT TGAAAGAAC CA 1317 
T ACT TT GT T CAAG CC GT GGAT T AC GGAGAT TAT AT CT ACT T CTT CTT C AGGGAAAT AG CA 720 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I 

T ACT TT GT T CAAGC C GT GGATT AC G GAGAT TAT AT CT ACT T CT T CT T CAGGGAAAT AGCA 1377 
GT G GAGT AT AACAC CAT GGGAAAGGT AGT T T T C C CAAGAGT GGCT CAG GTT T GT AAGAAT 7 80 

I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

GT GGAGT AT AAC AC CAT GGGAAAG GT AGT T T T C C CAAG AGT GG CT CAGGTTT GT AAGAAT 1437 

GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GC 8 4 0 
|| | | | | | | | | | | | | | I I I I I I I I I I I I II I I I I I I I I I I I I M I I II I I I I I I I I I I I I I 
GAT AT G GGAGGAT C T CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GT T C CT GAAGGC G C GC 14 97 

T T GAACT GCT C AGT T CCT GGAGACT CT C AT TT T T ATT T CAAC AT T CT C C AGGCAGT TAC A 900 

I | || I I I I I M I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I 

T T GAACT GCT CAGT T C CT GGAGACT CT CAT TT T T ATT T CAAC AT T CT C C AGGCAGT TAC A 1557 
GAT GT GATT C GTAT CAAC GGGC GT GAT GT T GT C CTGG CAAC GT TT T CT AC AC CT T AT AAC 960 

M I II I I I I II I I I I I I I I II I I I I I I M I I I I I I I I I I II I I I M I I II I I I I I M I I I 

GAT GT GATT C GTAT CAAC GGGC GT GAT GT T GT C CT G GCAAC GT T T T CT AC AC CTT AT AAC 1617 



Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

M I I I I I I I I 1 I I I I I I I I I I II I I I I I I I > I I I I I I I M I I I I I I I I I I M M I I I I I I 

Db 1618 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1677 

Qy 1021 GGGAGATT CAAG GAACAGAAGT CT C CT GAT T CCAC CT GGAC ACCAGT T C CT GAT GAAC GA 1080 

I I I I I I I I I I I I I M I II I I I I I I I II I I II I II I I I I I I I I I II I II I I I I I I II I I I I 
Db 1678 GGGAGAT T CAAGGAACAGAAGT CT C C T GAT T C CAC CT GGAC AC CAGTT C CT GAT GAAC GA 1737 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1738 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 17 97 

Qy 1141 T C CAAT GAGT T C CCT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC C C GCT CAT GGAT GAG 12 00 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1798 T C CAAT GAGT T C CCT GAT GAT AC CCT GAACT T CAT CAAGAC GCAC C C GCT CAT GGAT GAG 1857 

Qy 1201 GC AGT GC C CT C CAT CT T CAAC AG GC CAT GGT T CCT GAGAACAAT GGT C AGAT AC C GC CTT 1260 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1858 GC AGTG C C CT C CAT CTT C AACAGGC CAT G GT T C CT GAGAACAAT G GT CAGAT AC CGC CTT 1917 

Qy 1261 AC CAAAAT T GCAGT GGAC AC AGCT GCT GG GC CAT AT C AGAAT CAC ACT GT GGT T TT T CT G 1320 

I I I I II I I I M I I I II I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1918 AC CAAAATT GCAGT GGAC ACAGCT G CT GGGC CAT AT C AGAAT CAC ACT GT GGT T TT T CT G 1977 

Qy 1321 GGAT CAGAGAAGGGAAT CATCTT GAAGTTTTTGGCCAGAATAGGAAATAGTGGTTTT CTA 138 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 197 8 GGAT CAGAGAAGG GAAT C AT CT T GAAGTT T T T GGC C AGAAT AGGAAAT AGT GGT TT T CTA 2037 

Qy 1381 AAT GACAGC C T T T T C CT G GAGGAGAT GAGT GTT T ACAACT CT GAAAAAT GCAGCT AT GAT 144 0 

I I I M I I I I I I I I I I I I II I I I II I I I I I I I II I I I I II I I I I I I I 11 I II I I I I I I I I I 
Db 2038 AAT GACAGC CTT T T C CT GGAGGAGAT GAGT GT TTACAACT CT GAAAAAT G CAGCTAT GAT 2097 

Qy 1441 GGAGT C GAAGACAAAAGGAT CAT GGG CAT GCAGCT GGACAGAGCAAGC AGCT CT CT GT AT 1500 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2098 GGAGT C GAAGACAAAAGGAT CAT GGGCAT G CAGCT G G ACAGAGCAAGC AGCT CT CT GTAT 2157 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I II I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2158 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 2217 

Qy 1561 T GTAAAAAAACCT GTAT T GCCT CCAGAGACCCATATT GTGGATGGATAAAGGAAGGT GGT 162 0 

I I I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 2218 T GTAAAAAAAC CT GTAT T GC CT C C AGAGAC CCAT AT T GT GGAT GGAT AAAGGAAGGT GGT 2277 

Qy 1621 GC CT GCAGC C ATT TAT C ACC CAAC AGCAGACT GACTT T T G AGCAGGACAT AGAGC GT GGC 1680 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I M I I I I I I II I I I I I I I I I I I M I I I I I I I 
Db 227 8 GC CT GCAGC C ATT TAT C ACC CAAC AGCAGACT GACT T TT GAG CAGGAC AT AGAGC GT GGC 2337 

Qy 1681 AATACAGAT GGTCT GGGGGACT GT CACAAT TCCTTTGT GGC ACT GAATGGGCATT CCAGT 1740 

I I I I I I I II I I I I I I I I I I II I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2338 AATACAGAT GGT CT GGGG GACT GT CACAAT T C CT TT GT G GCAC T GAAT GGGCATT C CAGT 2397 

Qy 1741 TCCCTCTTG C CC AG CACAAC C ACAT CAGAT T C GACGG CT CAAGAG GGGT AT GAGT CT AGG 18 00 

I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 2398 T C CCT CT T GC CCAGCAC AACCACAT CAGAT T C GAC G GCT CAAGAGGGGT AT GAGT CT AGG 24 57 



Qy 


1801 


GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 


1860 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


2458 


GGAGGAAT GC T GGACT G GAAG CAT CT GC TT GACT CAC CT GACAGCAC AGAC CCTTTGGGG 


2517 


Qy 


1861 


GCAGT GTCTT CCCATAATCACCAAGACAAGAAGGGAGT GATT CGGGAAAGTTACCT CAAA 


1920 




1 I M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 




Db 


2518 


GCAGT GT CT T CC CAT AAT CAC CAAGACAAGAAGGGAGT GAT T C G G GAAAGT T ACC T CAAA 


2577 


Qy 


1921 


GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 


1980 




I I I I I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2578 


GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 


2637 


Qy 


1981 


ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 


2040 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


2638 


ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 


2697 


Qy 


2041 


GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 


2100 




1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 






2698 


GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 


2757 


Qy 


2101 


AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 


2160 




I I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


2758 


AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 


2817 


Qy 


2161 


GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 


2220 




1 1 1 1 1 1 1 1 M I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




nh 


2818 


GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 


2877 


Qy 


2221 


AT GCT CAT TAAAGC AGAC CAGC ACCAC CT GGAC CT GACGGC C CT C CC C AC C C CAGAGT CA 


2280 




I I M 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


2878 


AT GCT CAT TAAAGC AGAC CAG C ACCAC CT GGAC CT GAC GGC C CT C C C CAC C C CAGAGT CA 


2937 


Qy 


2281 


ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 


2340 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




LfkJ 


2938 


ACC C CAAC GCT GCAGCAGAAG C GGAAG CC CAGC C GC GGCAG CC GC GAGT GGGAGAGGAAC 


2997 


Qy 


2341 


CAGAACCTCATCAATGCCTGCACA7VAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 


2400 




I | || | | | | 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2998 


CAGAACCT CAT CAAT G C CT GC ACAAAGGAC AT GC CC C CCAT GG GCT C C CCT GT GAT T C C C 


3057 


Qy 


2401 


ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 


2460 




I | | | 1 1 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3058 


ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 


3117 


Ov 


2461 


AC G CAG C AGGGCT AC CAG CAT GAGTACGT GGAC CAGC CCAAAAT GAGC GAGGT GGCC C AG 


2520 




1 I 1 1 1 1 1 M 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3118 


AC GCAGC AGGG CT AC CAGCAT GAGTACGT G GAC CAGC CCAAAAT GAGC GAGGT GGCC CAG 


3177 


Qy 


2521 


AT GGCGCT GGAGGACCAGGCC GCCACACT GGAGTATAAGAC CAT CAAGGAACAT CTCAGC 


2580 


Db 


3178 


I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 

ATGGCGCTGGAGGACCAGGCCGCCACACTGGAGTATAAGACCATCAAGGAACATCTCAGC 


3237 


Qy 


2581 


AG C AAG AGT C C CAAC CAT G G G GT GAAC CI 1 G I G GAGAAC GIG G AG Ab uuICjCUUUU 






I | || | || | 1 | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3238 


AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 


3297 


Qy 


2641 


GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 


2700 



1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3298 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 3357 

Qy 2701 AGCAAGCGGCTGG7W\ATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I M 

Db 3358 AGC7\AGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 3417 

Qy 2761 C C CAC GAACT C GCT CAC G AGAAGC C AC CAG G C CAC CACT CT CAAAAGAAACAAC ACTAAC 2820 

II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3418 C C CAC GAACT C GCT CAC G AGAAG C CAC CAGGC CAC CACT C T CAAAAGAAACAACACTAAC 3477 

Qy 2821 T C CT C CAAT T C CT CT CAC CT C T C C AGAAAC CAGAG CTT T G GC AGGGGAGACAACC C GC C G 28 8 0 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3478 T C CT C CAAT T C CT CT CAC CT CT C CAGAAAC CAGAG CTT T GGC AGGGGAGACAACC C GC C G 3537 

Qy 28 81 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 294 0 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I 

Db 3538 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 3597 

Qy 2 941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I 

Db 3598 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3657 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 

Db 3658 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3717 

Qy 3061 ACAT C CAT GAAGC C CAAT GAT G C GT GT ACAT AA 3093 

I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I 
Db 3718 ACAT C CAT GAAG C C CAAT GAT GC GT GT ACAT AA 3750 
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FEATURES Location/Qualifiers 
source 1. .3862 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db__xref= M taxon: 9606" 

/ chromosome^ " 5 " 

/map="5q21-22" 
CDS 658. .3750 

/note="guidance signal" 

/codon_start=l 

/product="semaphorin SEMA6A1" 
/protein_id="AAG29378 .1" 
/db_xref="GI : 11093651" 

/translation="MRSEALLLYFTLLHFAGAGFPEDSEPISISHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNGTLYIA7VRDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDALFVCGTNAFNPSCRNYKMDTLEPFGDEFS 
GMARCPYDAKHANVALFADGKLYSATVTDFLAI DAVI YRSLGESPTLRTVKHDSKWLK 
EPYFVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSF 
LKARLN C S VP GD S H FY FN I LQAVT DVI RI NGRD WLAT FS T P YN S I P GS AVCAYDMLD 
IASVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLERYATSNEFPDDTLNFI 
KTHPLMDEAVPSIFNRPWFLRTMVRYRLTKIAVDTAAGPYQNHTWFLGSEKGIILKF 
LARIGNSGFLNDSLFLEEMSVYNSEKCSYDGVEDKRIMGMQLDRASSSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWIKEGGACSHLSPNSRLTFEQDIERGNTDGLG 
DCHNSFVALNGHSSSLLPSTTTSDSTAQEGYESRGGMLDWKHLLDSPDSTDPLGAVSS 
HNHQDKKGVIRESYLKGHDQLVPVTLLAIAVI LAFVMGAVFSGITVYCVCDHRRKDVA 
WQRKEKELTHSRRGSMSSVTKLSGLFGDTQSKDPKPEAI LTPLMHNGKLATPGNTAK 
MLIKADQHHLDLTALPTPESTPTLQQKRKPSRGSREWERNQNLINACTKDMPPMGSPV 
IPTDLPLRASPSHIPSWVLPITQQGYQHEYVDQPKMSEVAQMALEDQAATLEYKTIK 
EHLSSKSPNHGVNLVENLDSLPPKVPQREASLGPPGASLSQTGLSKRLEMHHSSSYGV 
DYKRSYPTNSLTRSHQATTLKRNNTNSSNSSHLSRNQSFGRGDNPPPAPQRVDSIQVH 
SSQPSGQAVTVSRQPSLNAYNSLTRSGLKRTPSLKPDVPPKPSFAPLSTSMKPNDACT 
tt 

ORIGIN 

Query Match 100.0%; Score 3093; DB 9; Length 3862; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3093; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 658 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 717 

Qy 61 CCAGAAGATT CT GAGCCAATCAGTATTT CGCAT GGCAACTATACAAAACAGTATCCGGT G 120 

I II I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II 

Db 718 CCAGAAGATT CT GAGCCAATCAGTAT TTCGCATGGCAACTATACAAAACAGTAT CCGGT G 777 

Qy 121 TTT GT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGATG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 778 TTTGTGGGCCACAAGCCAGGACGGAACAC CACACAGAGGCACAGGCT GGACAT CCAGAT G 837 

Qy 181 AT TAT GAT CAT GAAC GGAACC CT CT AC AT T GCT GCT AGGGAC CAT AT T TAT ACT GTT GAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I II I I I I I I I I I I I I I 
Db 838 AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T GCT GCT AGG GAC CAT AT T TAT AC T GTT GAT 897 



QY 



241 AT AGACAC AT CAC ACAC GGAAGAAAT T TAT T GT AG CAAAAAACT GACAT G GAAAT CT AGA 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



8 98 ATAGACACAT CACACACGGAAGAAATTT ATT GTAGCAAAAAACT GACAT GGAAAT CTAGA 957 



Qy 301 C AGGC CGAT GT AGAC AC AT G C AGAAT GAAGG GAAAAC AT AAG GAT GAGT G C CACAACT T T 360 

I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I M I 
Db 958 C AGGC CGAT GT AGAC AC AT G C AGAAT GAAGG GAAAAC AT AAG GAT GAGT GC CACAACT T T 1017 

Qy 361 ATTAAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GT TT GT C T GT GGAACT AAT GC CT T C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I 
Db 1018 ATTAAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GT TT GT C T GT GGAACTAAT GC CT T C 1077 

Qy 421 AAC C CTT C CT G CAGAAACT AT AAGATGGAT AC AT T GGAAC C ATT C GG G GAT GAAT T CAGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1078 AACCCTT CCT GCAGAAACTAT AAGATGGAT ACATT GGAAC CATT CGGGGAT GAATTCAGC 1137 

Qy 4 81 G GAAT G GC CAGAT G C C CAT AT GAT G CCAAACAT G C CAAC GT T GCACT GT T T GCAGAT GGA 540 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1138 GGAAT GGCCAGAT GCC CATAT GAT GCCAAACATGCCAACGTT GCACT GTTT GCAGAT GGA 1197 

Qy 541 AAACT AT ACT CAGC C ACAGT GACT GACT T CCT T G C CAT T GAC GCAGT CAT T T AC C GGAGT 600 

I I I II I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1198 AAACTAT ACT CAGC CACAGT GACT GACT T C CTT G C CATT GAC G C AGT C AT TTACC GGAGT 1257 

Qy 601 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 660 

I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1258 CTT G GAGAAAG C C CT AC C CT GC G GACC GT CAAGC ACGATT CAAAATGGT T GAAAGAAC CA 1317 

Qy 661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 1318 TACT T T GT T CAAGC C GT GGAT T AC GGAGATT AT AT CT ACTT CTT CTT CAGGGAAAT AGCA 1377 

Qy 721 GTGGAGT ATAACAC CAT GGGAAAGGTAGTT T T C C CAAGAGT GG CT CAGGT TT GT AAGAAT 7 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
Db 1378 GT GGAGT AT AACAC CAT GGGAAAGGTAGTT T T C C CAAGAGT GGCT CAG GT T T GTAAGAAT 1437 

Qy 781 GATAT GGGAGGAT CT CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GTT C CT GAAG GCGC GC 84 0 

I I I I I I I II I I I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1438 GATATGGGAGGAT CT CAAAGAGT CCT GGAGAAAC AGT GGAC GT CGTT CCT GAAGGCGCGC 1497 

Qy 841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1498 T T GAACT G CT C AGT T C C T GGAGACTCT CAT T TT T AT T T CAAC AT T CT C CAG GC AGTT ACA 1557 

Qy 901 GAT GT GAT T C GT AT CAAC GG GCGT GAT GTT GT C C T GG CAAC GT T T T CT AC ACCT T AT AAC 960 

I I I I I II I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1558 GAT GT GAT T C GT AT CAAC GG GCGT GAT GTT GTC CT G GCAAC GT T T T CT ACACCT TAT AAC 1617 

Qy 961 AGCAT C C CT GG GT CT GCAGT CT GT GC CT AT GAC AT GCTT GACAT T GC C AGT GT T T TT ACT 1020 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1618 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1677 

Qy 1021 GGGAGAT T CAAGGAAC AGAAGT CT CCT GATT C C ACCT GGAC AC CAGT T C CT GAT GAAC GA 10 8 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 1678 GGGAGATTCAAGGAACAGAAGT CTCCT GATT CCACCT GGACAC CAGTTCCTGAT GAAC GA 1737 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1738 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 17 97 



Qy 1141 TCCAAT GAGTTCCCT GAT GATACCCTGAACTT CATCAAGACGCACCCGCT CATGGAT GAG 12 00 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I N I | | II II Ml | | | | | I I I I I I I 
Db 1798 T CCAAT GAGTT CCCT GATGATACCCT GAACTT CATCAAGACGCACCCGCT CATGGAT GAG 1857 

Qy 1201 G CAGT GC C CT CC AT C T T CAAC AGGC CAT GGT T C CT GAGAACAAT G GTCAGAT AC C GC CTT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1858 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 1917 

Qy 1261 AC CAAAAT T GCAGT GGAC AC AGCT GCT GGGC C AT AT C AGAAT C ACACT GT G GTT T T T CT G 1320 

M II I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I I I I II 

Db 1918 ACCAAAATT GCAGTGGACACAGCT GCT GGGCCATAT CAGAAT CACACTGT GGTTTTT CTG 1977 

Qy 1321 GGATCAGAGAAGG GAAT CAT CTT GAAGT TT T T GGCCAGAAT AG GAAAT AGT G GT T T T C T A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1978 GGATCAGAGAAGGGAATCAT CTTGAAGTTTT T GGC CAGAAT AGGAAAT AGT GGTTTT CT A 2 037 

Qy 1381 AAT GAC AGC CTT T T C CTGGAGGAGAT GAGT GTT T ACAACT CT GAAAAAT GCAGCT AT GAT 1440 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2038 AAT GACAGC CTT T T C CT G GAGGAGAT GAGT GTT T ACAACT CT GAAAAAT GCAGCT AT GAT 2097 

Qy 14 41 GGAGT C GAAGACAAAAGGAT CATGGGCATG CAGCT GGAC AGAGCAAGC AGCT CT CT GT AT 1500 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I I I I I I I I I I 
Db 2098 GGAGTC GAAGACAAAAGGAT CAT GG GCAT GCAGCT GGAC AGAGCAAGCAGCT CT CT GT AT 2157 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2158 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 2217 

Qy 1561 T GTAAAAAAACCT GTATT GCCT CCAGAGACC CATATT GT GGAT GGATAAAGGAAGGT GGT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2218 T GTAAAAAAACCT GT AT T G C CT CC AGAGAC C CAT AT T GT GGAT G GAT AAAG GAAGGT GGT 2277 

Qy 1621 GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2278 GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 2337 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 1740 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2338 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 2397 

Qy 1741 TCCCTCTT GC CCAG C ACAAC C AC AT C AGAT T C GACGGCT CAAGAGGGGT AT GAGT CT AGG 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2398 TCCCTCTTGCC CAG C ACAAC C AC AT C AGAT T C GACGG CT CAAGAGGGGT AT GAGT CT AGG 2 4 57 

Qy 1801 GGAGGAAT GCTGGACT GGAAGCAT CT GCTT GACT CAC CT GACAGCACAGACCCTTT GGGG 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 24 58 GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 2 517 

Qy 1861 G CAGT GT CT T C C CAT AAT CAC CAAGACAAGAAGG GAGT GATT C G GGAAAGT T AC CT CAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2518 GCAGT GT CT T C C CAT AAT CAC CAAGACAAGAAGGGAGT GATT C G GGAAAGT T AC CT CAAA 2577 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 198 0 

I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2578 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2637 



Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2 63 8 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2697 

Qy 2041 GT G G CT GT GGT GC AG C G C AAGGAGAAGGAGCT C AC C C ACT CGCGCCGGGGCTC CAT GAGC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 69 8 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2757 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2758 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2817 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 2818 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2877 

Qy 2221 AT GCT C AT TAAAGCAGAC C AG CAC CAC CT GGAC CT GAC GGC C CT C C CCAC CC CAGAGT CA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 287 8 AT GCT CAT TAAAGCAGAC CAGCAC CAC CT GGACCT GAC GGC C CT C C CCAC CC CAGAGT CA 2937 

Qy 2281 AC C C CAACGCT GC AGCAGAAGC G GAAGCC C AGC C GC G GCAGC CG C GAGT GGGAGAGGAAC 234 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 2938 AC C C CAACGCT GC AGCAGAAGC G GAAGCC C AGC C G C GGCAGC CG C GAGT GGGAGAGGAAC 2997 

Qy 2341 CAGAACCTCATCAATGCCTGCACA7UVGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2998 CAGAAC CTCAT CAAT GC CT GC ACAAAGGACAT GC C C C C CAT G GG CT CC CCTGT GAT T C CC 3057 

Qy 24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3058 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 3117 

Qy 2461 AC GCAG CAG GGCT AC CAGCAT GAGT AC GT GGAC C AGC C CAAAAT GAGC GAGGT GGC C CAG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3118 AC GCAG CAG GGCT AC CAGCAT GAGT AC GT GGACC AGC C CAAAAT GAGC GAGGT G GC C CAG 3177 

Qy 2521 AT GGCGCTGGAGGACCAGGCCGCCACACT GGAGTATAAGACCATCAAGGAACAT CT CAGC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 317 8 AT G GC GCTGGAGGAC CAGGC C GC CAC ACT GGAGT AT AAGAC CAT CAAGGAAC AT CT CAGC 32 37 

Qy 2581 AGCAAGAGT C C CAAC CAT GGGGT GAAC CT T GT GGAGAACCT G GAC AGC CT GC C C CC CAAA 2640 

I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3238 AGCAAGAGT C C CAAC CAT GGGGT GAACCT T GT GGAGAACCT G GACAGC CT G C C C CC CAAA 3297 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 3298 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 3357 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3358 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 3417 

Qy 2761 C CCAC GAACT C GCT CAC GAGAAGC CAC CAGGC C ACC ACT CT CAAAAGAAACAACACT AAC 282 0 

M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3418 C CCAC GAACT CGCT CACGAGAAGCCACCAGGC CACCACTCT CAAAAGAAACAACACTAAC 3477 



Qy 



2821 T C CT C CAAT T C CT CT CAC CT CT C C AGAAAC CAGAGC T T T GGC AGG GGAGACAACC C G C C G 28 8 0 



I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 

Db 3478 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 3537 

Qy 2881 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2940 

I I I I II I I II I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I 

Db 3538 CC C GC C C C GCAGAGGGT G GACT C CAT C CAGGT GCAC AGCT CC CAG C CAT C T G GC CAGGC C 3597 

Qy 2 941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

I M I I I I I II I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 3598 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3657 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3658 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3717 

Qy 3061 AC AT C CAT GAAG CCCAAT GAT GC GT GTACAT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3718 AC AT C CAT GAAGC C CAAT GAT G C GT GT AC AT AA 37 50 
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Matches 3072; Conservative 



0; Mismatches 21; Indels 



2; Gaps 



Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

Qy 61 C CAGAAGAT T CT GAGC CAAT C AGT AT T T CG CAT GG CAACT ATACAAAAC AGT AT C C GGT G 120 

I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 274 C CAGAAGATT CT GAGC CAAT CAGT AT T T CG CAT GG CAACT ATACAAAAC AGT AT C C GGT G 333 

Qy 121 TTT GT GGGCCACAAGCCAGGAC GGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 180 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 TTT GT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 393 

Qy 181 ATTATGATCATGAACGGAACCCTCTACATTGCTGCTAGGGACCATATTTATACTGTTGAT 240 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ATTAT GAT CAT GAACGGAACCCT CT ACATT GCTGCT AGGGACCATATTT ATACT GTTGAT 4 53 

Qy 241 ATAGACAC AT C ACACAC GGAAGAAATT T AT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 AT AGACAC AT CACACAC GGAAGAAATTT AT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 513 

Qy 301 CAGG C CGAT GT AGACAC AT GCAGAAT GAAG GGAAAACATAAGGAT GAGT GC C ACAACT T T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 514 CAGGCCGATGTAGACACAT GCAGAAT GAAG GGAAAACATAAGGAT GAGT GCCACAACTTT 573 

Qy 361 ATT AAAGTT CT T CTAAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGAACTAAT GC CT T C 420 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 574 AT TAAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GTT T GT CT GT GGAACTAAT GC CT T C 633 

Qy 421 AAC CCTTCCTG C AGAAACT ATAAGAT GGAT ACAT T GGAAC CAT T C GGGGAT GAAT T C AGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
Db 634 AAC C CTT C CT GC AGAAACT AT AAGAT G GAT ACAT T GGAAC CAT T C GGG GAT GAAT T CAG C 693 

Qy 4 81 GGAAT GGC C AGAT GCC C ATAT GATGC CAAAC AT GC CAAC GT TGC AC T GT TT GC AGAT GGA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 694 GGAAT GGC CAGAT GCCCATAT GATGCCAAACATGCCAACGTTGCACTGTTTGCAGAT GGA 753 

Qy 541 AAACT AT ACT CAGC CAC AGT GACT GACT T C CT T GC CAT T GACGCAGT C AT TT AC CGGAGT 600 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 754 AAACT AT ACT CAGC CAC AGT GACT GAC T T C C T T GC CAT T GACGCAGT C AT TT AC CGGAGT 813 

Qy 601 CT T GGAGAAAGC C CTAC C CT GC GGAC C GT C AAGC AC GAT T CAAAAT GGT T GAAAGAACCA 660 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 CT T GGAGAAAG C C CT AC C CT GC GGAC C GT CAAGC AC GATT CAAAAT GGT T GAAAGAAC CA 87 3 

Qy 661 TACT T T GT T CAAGCC GT GGAT T AC GGAGATT AT AT CTACT T CT T CTT CAG GGAAAT AGCA 720 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 874 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 933 

Qy 721 GT GGAGT ATAAC ACCAT GGGAAAGGT AGT T T T C C CAAGAGT GGCT CAG GT T T GT AAGAAT 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 934 GT G GAGT AT AACACC AT GGGAAAGGT AGTT T T C C CAAGAGT GGCT CAGGT T T GT AAGAAT 993 

Qy 781 GAT AT GG GAGGAT CT CAAAGAGT C CT G GAGAAAC AGT GGACGT CGTT C CT GAAG GC G C GC 840 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 GAT AT GGGAGGAT CT CAAAGAGT C C T GGAGAAAC AGT G GACGT C GTT C C T GAAGGC GCGC 1053 



Qy 
Db 



841 
1054 



900 
1113 



Qy 901 GAT GT GAT T C GT AT CAAC GGGC GT GAT GT T GT C C T G GC AAC GT T T T CT AC AC CT TAT AAC 960 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1114 GAT GTGAT T C GT AT CAAC G G GCGT GAT GTT GT C C T GGCAAC GT T TT CT AC AC CT TAT AAC 1173 

Qy 961 AGCAT CCCTGGGTCT GCAGT CT GT G C C TAT GAC AT GCT T GAC AT T G CC AGT GT T T T TACT 1020 

I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1174 AGCAT C C CT GGGT CT GCAGT CTGTGCC TAT GACAT GCT TGACATTGCCAGTGTTTT TACT 1233 

Qy 1021 G GGAGAT T CAAGGAACAGAAGT CT C CT GATT C C ACCT GGACACC AGT T C CT GAT GAAC GA 10 8 0 

I I I I I II I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I M I I I I I I I 

Db 1234 G G GAGATT CAAGGAACAGAAGT CT C C T GATT C C ACCT GGACAC C AGT T C CT GAT GAAC GA 1293 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1294 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1353 

Qy 1141 T C CAAT GAGT T C C CT GAT GAT ACC CT GAACTT C AT CAAGAC GC AC C C GCT CAT GGAT GAG 12 00 

I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 1354 T C CAAT GAGT T C C CT GAT GAT ACC C T GAACT T CAT CAAGAC GCAC C C GC T CAT GGAT GAG 1413 

Qy 1201 GCAGT GC C C T CC AT CT T CAAC AGGC CAT GGT T C CT GAGAACAAT GGT CAGAT ACC GC CT T 1260 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1414 G C AGT GC C C T CC AT CT T CAACAGGC C AT GGT T C C T GAGAACAAT GGT CAGAT ACC GC CT T 1473 

Qy 12 61 ACCAAAATT GCAGT GGACACAGCT GCT GGGCCATATCAGAATCACACTGT GGTTTTT CT G 132 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 

Db 1474 ACCAAAATT GCAGT GGACACAGCT GCT GGGCCATATCAGAATCACACTGT GGTTTTT CT G 1533 

Qy 1321 G GAT CAGAGAAGG GAATCAT CT T GAAGT T TT T GGC CAGAATAGGAAAT AGT GGTT T T CT A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 

Db 1534 GGAT CAGAGAAGG GAAT CAT CTT GAAGT T TT T GGC CAGAATAGGAAAT AGT GGTT T T CT A 1593 

Qy 1381 AAT GACAGC CTTT T C C TGGAGGAGAT GAGT GT T T ACAACT CTGAAAAAT G CAGCT AT GAT 1440 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 

Db 1594 AAT GACAGC CTTTT C CT GGAGGAGAT GAGT GTTT ACAACT CTGAAAAAT GCAGCT AT GAT 1653 

Qy 1441 GGAGT C GAAGACAAAAGGAT CAT GGGC AT GCAG CT GGACAGAGCAAG CAGCT CT CT GT AT 15 00 

I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1654 GGAGTC GAAGACAAAAGGAT C AT GG GC AT GCAGCT GGAC AGAGCAAGCAGCT CT CT GT AT 1713 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 15 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1714 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 17 7 3 

Qy 1561 T GT AAAAAAACCT GT ATT G C CT CCAGAGAC C CAT ATT GT G GAT G G AT AAAG GAAGGT G GT 1620 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1774 T GT AAAAAAACCT GTATT GC CT CCAGAGACCCAT ATT GT GGAT GGAT AAAGGAAGGTGGT 1833 



Qy 

Db 



1621 
1834 



1680 
1893 



Qy 1681 AAT ACAGAT G GT C T GGGG GACT GT CACAAT T C CT T TGT GG CACT GAAT GGG CAT T CC AGT 174 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1894 AAT ACAGAT GGT CT GGGGGACT GT CACAAT T C CT T T GT GGC ACT GAAT GGGCAT T CC AGT 1953 

Qy 1741 TCCCT CTT GCCCAGCACAAC CACAT CAGATT CGACGGCTCAAGAGGGGTAT GAGT CT AGG 1800 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I 
Db 1954 TCCCTCTT GC C CAGCACAAC CACAT CAGAT T C GAC GGCT CAAGAG GGGT AT GAGT CT AGG 2013 

Qy 18 01 GGAGGAAT GCT GGACT GGAAGCAT CTGCTT GACTCAC CTGACAGCACAGAC CCTTTGGGG 1860 

I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I 
Db 2014 GGAGGAAT GCT GGACT GGAAG CAT CT G CTT GACT CAC C T GACAGCACAGAC C CT T T GGGG 2073 

Qy 1861 GCAGT GT CTT CCCATAAT CACCAAGACAAGAAGGGAGT GATT CGGGAAAGTTAC CTCAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 074 GCAGT GT CTT C CC ATAAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGT T AC CT CAAA 2133 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I M I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I 
Db 2134 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2193 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2194 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2253 

Qy 2041 GT GGCT GT GGT GCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I | | I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 2254 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2313 

Qy 2101 AG C GT CAC CAAGC T CAG CGGCCTCTTT GG GGAC AC T CAAT C CAAAGAC CCAAAG C C G GAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2314 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2373 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2374 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2433 

Qy 2221 ATGCTCATTAAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Db 2434 AT GCT C ATT AAAG CAGACCAGC AC CAC CT GGAC CT GAC GGC CCT CC C CAC C C CAGAGT C A 2493 

Qy 2281 AC C C CAAC G CT GCAGCAGAAGC GGAAGCC C AGC C GC G GCAGCC GCGAGT G G GAGAGGAAC 234 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2494 AC CCCAACGCTGCAGCAGAAGCGGGAACCCAGCCGCGGCACCC GCGAGT GGGAGAGGAAC 2553 

Qy 2341 CAGAAC CT C AT CAAT GC CT GCACAAAGGAC AT GC CC C CCAT GGGCTCCCCTGT GAT T C C C 2400 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I 
Db 2554 CAGAAC CT CAT CAAT G C CT GCACAAAG GAC AT GC CC C C CAT GGGCT C CCCT GT GAT T C C C 2613 

Qy 24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I 
Db 2614 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2673 

Qy 24 61 ACGCAGCAGGGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAG 2520 

I I I II I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2 674 AC GC AG CAG GG C T AC C AGC AT GAGT AC GT GGAC CAGC C C AAAAT GAGC GAGGT GGC C CAG 2733 



Qy 



2521 AT GGC GCT GGAGGACCAGGC CGCCACACTGGAGTATAAGACCAT CAAGGAACAT CT CAGC 2580 



Db 



2734 



2793 



Qy 2 581 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 2 64 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M II I I I I I I I I I I I I I I I I I I I I M I I 

Db 2794 AG CAAGAGT C C CAAC CAT G G GGT GAACCT T GT GGAGAAC CT G GACAGC CT GC C CC C CAAA 2853 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I M I 

Db 2 854 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2 913 

Qy 2701 AGCAAGCGGCTGGA7\ATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2914 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2973 

Qy 2761 C C CAC GAACT C G CT CACGAGAAGC C ACC AGGC CAC C - ACT CT CAAAAGAAACAACACT AA 2 819 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2974 C C CAC GAACT C GCT CACGAGAAG C CACCT GAC CAC CT ACT CT C AT CAGAAGCAACACT AA 3033 

Qy 2 820 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 2878 

Ml I I I I I I III II II I I I I I I I I I I I M I I I I I I I I I I I I I I II I 

Db 3034 C C CC GACAATT CAN CT CT GACT T CAAAGGGAC CAGAGCT T T GGCAGGGGAGACAAC CC G C 3093 

Qy 287 9 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2 938 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3094 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 3153 

Qy 2939 C C GT GACT GTCTC GAG GCAGCCCAGCCT CAAC GCCTACAACTC ACT GACAAGGTCGGGGC 2 998 

I I I I I I I I II I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3154 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3213 

Qy 2999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 3214 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3273 

Qy 3059 C CACATC C AT GAAGC C CAAT GAT GC GT GT AC AT AA 3093 

I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I 
Db. 3274 C CAC AT C CAT G AAG C C CAAT GAT G C G T GT AC AT AA 3308 
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Homo sapiens mRNA for KIAA1368 protein, partial cds . 
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Location/ Qualifiers 

1. .4250 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="f j03125" 
/tissue_type= "brain" 
/clone_lib="pBluescriptII SK plus" 
1. .4250 

/gene="KIAA1368" 
<244. .3393 
/gene="KIAA1368" 

/note="Start codon is not identified." 
/ codon_start=l 
/product="KIAA1368 protein" 
/protein_id="BAA92606. 1" 
/db_xref="GI : 7243117" 

/ trans lation="TTMRSEALLLYFTLLHFAGAGFPEDSEPISISHGNYTKQYPVFV 
GHKPGRNTTQRHRLDIQMIMIMNGTLYIAARDHIYTVDIDTSHTEEIYCSKKLTWKSR 
QADVDTCRMKGKHKDECHNFIKVLLKKNDDALFVCGTNAFNPSCRNYKMDTLEPFGDE 
FS GMARC P YDAKHANVAL FADGKL YS ATVTDFLAI DAVI YRS LGES PTLRTVKHDS KW 
LKEPYFVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWT 
SFLKARLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDM 
LDIASVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLERYATSNEFPDDTLN 
FIKTHPLMDEAVPSIFNRPWFLRTMVRYRLTKIAVDTAAGPYQNHTWFLGSEKGIIL 
KFLARIGNSGFLNDSLFLEEMSVYNSEKCSYDGVEDKRIMGMQLDRASSSLYVAFSTC 
VIKVPLGRCERHGKCKKTCIASRDPYCGWIKEGGACSHLSPNSRLTFEQDIERGNTDG 
LGDCHNSFVALNDISTPLPDNEMSYNTVYGHSSSLLPSTTTSDSTAQEGYESRGGMLD 
WKHLLDSPDSTDPLGAVSSHNHQDKKGVI RESYLKGHDQLVPVTLLAIAVILAFVMGA 
VFSGITVYCVCDHRRKDVAWQRKEKELTHSRRGSMSSVTKLSGLFGDTQSKDPKPEA 
ILTPLMHNGKLATPGNTAKMLIKADQHHLDLTALPTPESTPTLQQKRKPSRGSREWER 
NQNLINACTKDMPPMGSPVIPTDLPLRASPSHIPSVWLPITQQGYQHEYVDQPKMSE 
VAQMALEDQAATLEYKTIKEHLSSKSPNHGVNLVENLDSLPPKVPQREASLGPPGASL 
SQTGLSKRLEMHHSSSYGVDYKRSYPTNSLTRSHQATTLKRNNTNSSNSSHLSRNQSF 
GRGDNPPPAPQRVDSIQVHSSQPSGQAVTVSRQPSLNAYNSLTRSGLKRTPSLKPDVP 
PKPS FAPLSTSMKPNDACT " 



ORIGIN 



Query Match 98.0%; Score 3032; DB 9; Length 4250; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 3093; Conservative 0; Mismatches 0; Indels 51; Gaps 1; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 



QY 



61 C CAGAAGAT T CT GAGC CAAT C AGT AT TT C GC AT GGCAACT AT ACAAAAC AGT AT C C GGT G 120 



Db 



310 



369 



Qy 121 TTTGTGGGC CACAAGCC AGGAC GGAACAC CAC ACAGAGGC AC AGGCT GGACAT C CAGAT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I II I I I I I I 1 I I I 
Db 370 TTT GT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGAT G 42 9 

Qy 181 ATTAT GAT CATGAACGGAACCCT CTACATT GCT GCT AGGGACCATATTTATACT GTT GAT 240 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

Db 430 ATTAT GAT CATGAACGGAAC CCT CTACATT GCTGCT AGGGACCATATTTATACT GTT GAT 489 

Qy 241 AT AGAC AC AT CACAC AC GGAAGAAAT T TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I I I I I I II II I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 490 ATAGAC ACAT CACAC AC GGAAGAAAT TTAT T GT AGCAAAAAAC T GACAT G GAAAT CT AGA 54 9 

Qy 301 CAGGC CGAT GTAGACACAT GCAGAATGAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 360 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 550 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 609 

Qy 361 ATT AAAGT T CTT CT AAAGAAAAACGAT GAT GC AT T GT TT GT CT GT GGAACT AAT GC CTT C 42 0 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 610 AT T AAAGT T CTT CTAAAGAAAAACGAT GAT GCAT T GT T T GT CT GT GGAACT AAT GC C TT C 669 

Qy 421 AAC CCT T CCT GC AGAAACT ATAAGAT GGAT AC AT T GGAAC CAT T C GGGGAT GAATT CAGC 48 0 

I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 670 AAC CC T T C CT G CAGAAACT AT AAGAT GGATACATT GGAAC CAT T C G GGGAT GAAT T CAGC 72 9 

Qy 481 GGAAT GGC CAGAT GC C CAT AT GAT G C CAAACAT GC CAAC GTT G C ACT GT T T GCAGAT GGA 54 0 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 730 GGAAT GGC CAGAT GC C CAT AT GAT G C CAAACAT GC CAAC GTT GC ACT GT T T G CAGAT GGA 78 9 

Qy 541 AAACT AT ACTCAG C C ACAGT GAC T GACT T C CT T GC C AT T GAC GCAGT C ATTT ACC GGAGT 600 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 790 AAACT AT ACT CAGC CACAGT GACTGACT T C CT T GC CAT T GACG CAGT CAT TT ACC GGAGT 84 9 

Qy 601 CT T GGAGAAAG C C CT ACC CT GC GGAC CGT CAAGCAC GAT T CAAAAT GGT T GAAAGAAC CA 660 

I | | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I II I I I 
Db 850 CT T GGAGAAAGC C CT ACC CT GC GGAC CGT CAAGCAC GAT T CAAAAT GGT T GAAAGAAC CA 909 

Qy 661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 720 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I II I I I I I I I I I I I I I I I I I I 

Db 910 T ACTT T GT T CAAGC C GT GGAT TAC G GAGATT AT AT CT ACT T CTT CT T C AG GGAAAT AG CA 969 

Qy 721 GT GGAGT AT AAC AC C AT GGGAAAG GT AGT TT T CC CAAGAGT GGCT CAG GT TT GT AAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I 
Db 970 GT GGAGT AT AAC AC CAT G GGAAAGGTAGT TT T CCCAAGAGT GGCT CAGGT T T GT AAGAAT 1029 

Qy 781 GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAAC AGT GGAC GT C GT T C CT GAAGG C GC GC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I 
Db 1030 GAT AT GG GAGGAT CT CAAAGAGT C CT GGAGAAACAGT G GAC GT C GT T C CT GAAG GC GC G C 1089 

Qy 841 T T GAACT GCT CAGT T CCT GGAGACT CT C ATT T TTAT T T CAAC AT T CTC CAGGCAGT T ACA 900 

I I I I M I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 1090 T T GAACT GCT CAGT T CCT GGAGACT CT CATT T TT AT T T CAACAT T C T C CAGGCAGT T ACA 1149 

Qy 901 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

I | | | | | II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 



UD 


llJU 


PATGTGATTCGTATPAAPGGGPGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAJ\.C 


1209 


Qy 


961 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1020 




1 1 1 1 1 1 1 1 1 1 II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 i 1 1 1 1 M 1 M 1 1 II 1 1 1 1 1 1 




UD 


1910 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1269 


Qy 


1021 


G GGAGATT CAAGGAACAGAAGT CT C CT GAT T C CAC CT GGACAC C AGTT C CT GAT GAAC GA 


1080 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


197 0 


era T\c ATTP A AGGAAP AG A APTPTPPTGATTCCACCTGGACACCAGTTCCTGATGAACGA 


1329 


Qy 


1081 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1140 




1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


i "3 "3 n 


r T rp p r rri t\ a r;p p f a r; rir r* a ppt T G PT GT GPT GGC T C AT C CT C CT T AG AAAGAT AT GCAAC C 


1389 


Qy 


1141 


TCCAATGAGTTCCCTGATGATACCCTGAACTTCATCAAGACGCACCCGCTCATGGATGAG 


1200 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 M 1 1 1 1 1 1 1 1 




Dd 




mfpA 7\mr ziPTTPPPTPATPATAPPPTGAAPTTPATPAAGAPGPAPPCGCTCATGGATGAG 


1449 


Qy 


1201 


GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 


1260 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


1 A RH 


p p a p t p r r p t p p A T PT T r* A a p A GGP P ATGGTT P CT G AG AA C AAT GGT CAGAT AC CGC CT T 


1509 


Qy 


1261 


ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




UD 


i m n 

IjIU 


appz\ AZ\ ATTPP APTPPAP AP AGPTGPTGGGPPAT ATPAGAATCACACTGTGGTTTTTCTG 


1569 


Qy 


1321 


GGATCAGAGAAGGGAATCATCTTGAAGTTTTTGGCCAGAATAGGAAATAGTGGTTTTCTA 


1380 




I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Dd 


1 CTf) 

1j / U 


1_j(_7/\1 \^J\^f\^JAr\\J \j \jr\r\. X ^11 \jt\r\\3 X X X X X \jK3\^\^J-\\jJ-\J-\1. i-\\j\^r\r\r\ ± inAJ i uui x x l^in 


1629 


Qy 


1381 


AATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTACAACTCTGAAAAATGCAGCTATGAT 


1440 




1 I I I I I I 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


i fi^ n 

IDjU 


A ATP AP AGPPTTTTPPTGGAGGAGATGAGTGTTTAP AACTCTGAAAAATGCAGCTATGAT 


1689 


Qy 


1441 


GGAGTCGAAGACAAAAGGATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTAT 


1500 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




UD 




PPAPTPP A APAP AAA APP ATP ATGGGPATGPAGPTGGACAGAGCAAGCAGCTCTCTGTAT 


1749 


Qy 


1501 


GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 


1560 




1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 I M I 1 1 I 1! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




UD 


1 / DU 


PTTPPPTTPTPT APPTPTPTGATAAAGGTTPPPCTTGGCCGGTGTGAACGACATGGGAAG 


1809 


Qy 


1561 


TGTAAAAAAACCTGTATTGCCTCCAGAGACCCATATTGTGGATGGATAAAGGAAGGTGGT 


1620 






1 I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


i r i n 


tpta AAAAAAPPTPTATTGPPTPPAGAGAPPPATATTGTGGATGGATAAAGGAAGGTGGT 


1869 


Qy 


1621 


GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 


1680 




1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 




UD 


10 / U 


ppp^pp A PPPaTTT ATP APPP A APAPP AG APTPrAPTTTTP AGP AGGACATAGAGCGTGGC 


1929 


Qy 


lOOI 


J-\_r\. X r\\->J\\3s\ X ub X \— X \JUuuuav- X w X L«/lvyrlril X v_-\_« X X X \j X vj v_»v_,jr_^_« x ua 


1726 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1930 


AAT ACAGAT GGT CT G GGGGACT GT CACAAT T C CT T T GT GGCACT GAAT GAC AT TT CAACT 


1989 


Qy 


1727 




1749 


Db 


1990 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

C CT CT AC CAGAT AAT GAAAT GT CT TACAACAC AGTGT AT G G GCAT T C CAGT TCCCTCTTG 


2049 



1750 C C CAGCACAACCACAT CAGATTCGACGGCT CAAGAGGGGTATGAGT CTAGGGGAGGAATG 18 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2050 C C CAG CACAAC CAC AT C AGAT T C GAC GGCT CAAGAGGGGTATGAGT CT AGG GGAGGAAT G 2109 

1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 18 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 

2110 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 2169 

1870 T C CCATAAT CACCAAGACAAGAAGGGAGT GATTCGGGAAAGTTACCT CAAAGGCCACGAC 192 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
2170 T CCCATAAT CACCAAGACAAGAAGGGAGT GATT CGGGAAAGTTAC CT CAAAGGCCACGAC 222 9 

1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

2230 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 22 8 9 

1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 204 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I 

2290 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 234 9 

2050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2350 GT GCAGC GCAAG GAGAAG GAGCT CAC C C ACTC GC GC C G G GGCT C CAT GAGC AGC GT C ACC 24 09 

2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I 
2410 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2469 

2170 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 222 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I II I I I 

247 0 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2529 

2230 Aj^AGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 22 89 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

2530 AAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 258 9 

22 90 C T GCAGCAGAAGCGGAAG C C CAG C C GC GG CAGC C GC GAGT GG GAGAGGAAC C AGAACCT C 234 9 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I 

2590 CTGCAGCAGAAGCGGAAGCC CAGC CGCGGCAGCCGC GAGT GG GAGAGGAAC CAGAACCTC 2 64 9 

2350 AT CAAT GC CT GCACAAAGGACAT GC C C C C CAT GGGC T C C CCT GT GAT T CCC AC GGAC CTG 24 09 

II I I I I II I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
2650 AT CAAT G C CT GCACAAAGGACAT GC C C C C CAT GGGCTCCCCTGT GAT T CCC AC GGAC CT G 27 09 

2 410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2710 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 27 69 

247 0 GGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTG 252 9 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 

277 0 GGCT AC C AGCAT GAGT AC GT GGAC CAGC C CAAAAT GAGC GAGGT GGC CCAGAT GGC GCT G 2 82 9 

2 530 GAGGAC C AGGC CG C C AC ACT GGAGT AT AAGAC CAT CAAGGAAC AT CT CAGC AGCAAGAGT 258 9 

I II I I I I I I 11 I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

2830 GAGGAC CAGGCCGC CACACTGGAGT AT AAGAC CAT CAAGGAACAT CT CAGCAGCAAGAGT 28 89 



Qy 

Db 



2590 
2890 



CCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAG 2 64 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C C CAAC CAT GGGGT GAAC CT T GT GGAGAAC CTGG AC AG CCT GC C C CC CAAAGTT C CAC AG 294 9 



Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 2950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 

Qy 2710 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 27 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II M 
Db 3010 CT GGAAAT GCACCACT CCT CTT CCTAC GGGGTT GACTATAAGAGGAGCTAC CCCAC GAAC 3069 

Qy 2770 TCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTAACTCCTCCAAT 2 829 

I I i I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 307 0 T C GCT CAC GAGAAGC CAC CAGGC CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 3129 

Qy 2830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 28 8 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 3130 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3189 

Qy 28 90 C AGAGGGT GGACT C CAT C C AGGT GC ACAGCT C C CAG C CAT CT G GC CAGGC C GT GACT GT C 2 949 

I I I I I I I I I I II I I I I M II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3190 CAGAG GGT GGACT C CAT C C AGGT GC AC AG CT C C C AGC CAT CT GGC CAGG C C GTGACT GT C 3249 

Qy 2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I M I I I M I I I I I I I I II I I I I I I I I I I I 
Db 3250 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3309 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I II I I I II I I I II I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 3310 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 

Qy 307 0 AAG C C CAAT GAT G C GT GT AC AT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3370 AAGC C CAAT GAT GC GT GT AC AT AA 3393 
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AX780545 
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Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 
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Location/Qualifiers 



source 1- .4982 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 96.2%; Score 2975; DB 6; Length 4982; 

Best Local Similarity 97.8%; Pred. No. 0; 

Matches 3080; Conservative 0; Mismatches 13; Indels 55; Gaps 5; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 612 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 671 

Qy 61 C CAGAAGAT T CT GAGCCAAT C AGT AT T T C GC AT GGCAACTATACAAAAC AGT AT C C GGT G 120 

I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 672 C CAGAAGAT T CT GAGCCAAT C AGT AT T T C G CAT G GC AACT ATACAAAACAGT AT C C GGT G 731 

Qy 121 T T T GT GG GCCACAAGCCAGGAC GGAAC AC CACAC AGAGGCACAGGCT GGAC AT C C AGAT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 732 T TT GT GGGCCACAAG CCAGGAC GGAAC AC CACAC AGAGGCACAGGC T GGACAT C C AGAT G 7 91 

Qy 181 AT TAT GAT CAT GAAC GGAAC C CT CT AC AT T GCT GCT AGGGAC CAT AT T TAT ACT GTT GAT 240 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 92 AT TAT GAT CAT GAAC GGAAC C CTCT ACAT T GCT G CT AG GGAC CAT AT T TAT ACT GT T GAT 851 

Qy 241 AT AGACACAT C AC ACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GAC AT GGAAAT CT AGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 852 AT AGACACAT CACACACGGAAGAAATT TATT GT AGCAAAAAACT GACAT GGAAATCT AGA 911 

Qy 301 CAGG C C GAT GT AGACACAT GC AGAAT GAAG GGAAAAC ATAAGGAT GAGT GC CACAAC T TT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 912 C AGGC C GATGT AGACACAT GC AGAAT GAAGGGAAAAC AT AAGGAT GAGT GC CACAACT T T 971 

Qy 361 ATT AAAGT T C T T CT AAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACT AAT GCCTT C 420 

I | | I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 972 ATT AAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT T TGT CT GT GGAACT AAT GCCT T C 1031 

Qy 421 AAC C CT T C CT GCAGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T C GGGGAT GAAT T C AGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1032 AACC CT T C CT GCAGAAACT AT AAGAT G GAT ACAT T G GAAC CAT T C GGG GAT GAAT T C AGC 1091 

Qy 4 81 GGAATGGCCAGAT GCCCATAT GAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1092 GGAATGGC CAGAT GCCCATAT GAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 1151 

Qy 541 AAACTATACT CAGCCACAGT GACT GACTTC CTT GCCATTGACGCAGTCATTTACCGGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 1152 AAACTATACT CAGC CN CAGT GACT GACT T C CTT G CC AT T GACGCAGT CAT T T AC C GGAGT 1211 

Qy 601 CT T GG- AGAAAGC C CT AC CCT GC GGAC C GT CAAGCAC GATT CAAAAT GGT T GAAAGAACC 659 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1212 CTT GGN AGAAAGC C CT AC C CT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAACC 1271 



Qy 

Db 



660 AT ACTTT GTT CAAGCC GT GGATT AC GGAGAT TAT AT CT ACT T CT T CT T CAGGGAAAT AGC 719 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1272 AT ACTTN GT T CAAGCC GT G GATT ACGGAGAT TAT AT CT ACT T CT T CT T CAGGGAAAT AGC 1331 



Qy 


720 


Db 


1332 


Qy 


780 


Db 


1392 


Qy 


840 


Db 


1452 


Qy 


900 


Db 


1512 


Qy 


960 


Db 


1572 


Qy 


1020 


Db 


1632 


Qy 


1080 


Db 


1692 


Qy 


1140 


Db 


1752 


Qy 


1200 


Db 


1812 


Qy 


1260 


Db 


1872 


Qy 


1320 


Db 


1932 


Qy 


1380 


Db 


1992 


Qy 


1439 


Db 


2052 


Qy 


1498 


Db 


2112 



AGTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAA 779 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I > I I 

AGT GGAGT AT AAC AC CAT G GGAAAGGT AGT T T T C C C AAGAGT G GCT C AG GT T T GT AAGAA 1391 

T GAT AT G GGAGGAT CT CAAAGAGT C CT GGAGAAACAGT G GAC GT CGTT C CT GAAGG C GCG 839 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

T GAT AT GGGAGGAT CT CAAAGAGTCCT GGAGAAACAGTGGACGTCGTT CCT GAAGGCGCG 14 51 

CTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTAC 8 99 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTAC 1511 

AGAT GT GAT T C GT AT CAAC GGGCGT GAT GT T GT C CT GGCAAC GTTTT CT ACAC CT T AT AA 959 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M 
AGAT GT GAT T C GT AT CAAC GGG CGT GAT GTTGT CCT GGCAAC GTTT T CT ACAC C T T AT AA 1571 

CAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTAC 1019 

I M | | I I I I I I I I I I I I I I I II I I II II I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I 

C AGCAT CCCTGGGT CT GC AGT CT GT GC CT AT GACAT GCT T GACAT T GC C AGT GT T T T T AC 1631 

T GGGAGAT TCAAGGAAC AGAAGT C T C C T GAT T C C AC CT GGACAC CAGT T C CT GAT GAAC G 1079 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

T GGGAGATTCAAGGAACAGAAGTCT CCT GATT CCACCTGGACACCAGTT CCT GAT GAACG 1691 

AGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAAC 1139 

I | | | | | | I I I I I I I I I I I I I I II I I I II I I I I I I I M I M I I I I I I I I I I I I II I I I I I I 

AGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAAC 1751 

CTC CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAAGAC GCAC C C GCT CAT G GAT GA 1199 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II M I I I I I I I I I I I II I I I I I I I I 

CTC CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGACGC AC C C G CT CAT GGAT GA 1811 
GGCAGT G CC CT C CAT CT T CAACAGGC C AT GGT T C CT GAGAACAAT GGT CAGAT AC CGC CT 1259 

I I I M I I I I I i I I I I M I I I I I I I I I I I I I II I II I I I I I I I I M I I I II M I I I I I I M 

GG CAGT GCC CT C C AT CT T CAACAGGC CATGGTT C CT GAGAACAAT GGT CAGAT AC CG C CT 1871 

T AC CAAAAT T GCAGT GGACACAGC T GCT GG GC C AT AT CAGAAT CACACT GT G GT T TTT CT 1319 
I | | | | | | | | | | I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I M 
T AC CAAAAT T GCAGT GGACACAGCT GCT G GG C CAT AT CAGAAT CACACT GT GGTTTTTCT 1931 

GG GAT CAGAGAAG GGAAT CAT CT T GAAGT T T T T G GC CAGAAT AGGAAAT AGT GGT TT T CT 137 9 
M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GGGAT CAGAGAAGGGAAT CATCTT GAAGTTTTNGGC CAGAATAGGAAATAGT GGTTTT CT 1991 

AAAT GACAGC CTT TT C C T G GAG GAGAT G - AGT GT TT ACAACT CT GAAAAAT GCAGCT AT G 14 38 
I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
AAAT GACAGCCTT TT CCT GGAG GAGAT GN AGT GTTTACAACT CT GAAAAAT GCAGCT AT G 2051 

AT GGAGT C GAAGACAAAAGGAT CAT GGG CAT G~ C AG CT G GAC AGAGC AAGCAGCT CT CT G 1497 
I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GGAGT C GAAGACAAAAGGAT CAT GGG CAT GN CAGCT GGAC AGAGCAAGC AG CT CT CT G 2111 

TATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTG-GCCGGTGTGAACGACATGG 1556 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I M M I I I I I I I 

TATGTTGCGTNCTCTACCTGTGTGATAAAGGTTCCCCTTGNGCNGGTGTGAACGACATGG 2171 



Qy 


1 

loo / 


Db 


Zl i z 


Qy 


1 Ol / 


Db 


o o o o 


Qy 


lb / / 


Db 


2292 


Qy 


1 TOT 

1 / Z 1 


Db 


2352 


Qy 


1 / 4b 


Db 


2412 


Qy 


loUb 


Db 


2472 


Qy 


1 Q C C 


Db 


2532 


Qy 


i n o £i 

iyz b 


Db 


2592 


Qy 


iy o b 


Db 


2652 


Qy 


zU4b 


Db 


2712 


Qy 


zlUb 


Db 


O 1 1 O 

2772 


Qy 


zl bb 


Db 


2832 


Qy 


zzz b 


Db 


o o n o 


Qy 


2286 


Db 


2952 


Qy 


2346 



GAAGT GTAAAAAAACCT GTATT GCCT CCAGAGAC CCATATT GT GGAT GGATAAAGGAAGG 1616 
I I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I II I I I I I I I II I I I I I I I M 
GAAGT GT AAAAAAN C C T GTAT T GCNN C C AGAGAC CCAT AT T GT GGAT G GAT AAAGGAN G G 2231 

T GGT GC CT GCAG C CAT T TAT C AC CCAAC AGC AGACT GACT TT T GAGC AGGACAT AGAG C G 1676 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
T GGT GCCTGCAGCCATTTAT CAC CCAAC AGC AG ACT GACTTTT GAGCAGGACATAGAGC G 2291 

TGGCAATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGA 1726 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

T GGCAATAC AGAT GGT CT G GGG GACT GT CACAAT T C CT T T GT GG CACT GAAT GAC ATTT C 2351 

ATGGGCATTCCAGTTCCCT 174 5 

I I I I II I I I I I I I I I I I M 
AACT C CT CT AC CAGAT AAT GAAAT GT CT T ACAAC ACAGT GTAT G GGC AT T CC AGTT CC CT 2411 

CTT GC C CAGCACAAC C ACAT C AGAT T C GAC GGCT CAAGAGG GGT AT GAGT CT AGGGGAGG 18 05 
I | | | | | | | || I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I 
CTT GC C CAG CACAAC CACAT C AGATT C GAC GGCT CAAGAGGGGT AT GAGT CT AG GGGAG G 2471 

AATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGT 18 65 

Ml I I I I I I I I I I II I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I 

AATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGT 2531 

GT CT T C CCAT AAT CAC CAAG ACAAGAAGGGAGT GAT T C GGGAAAGTT AC CT CAAAGG C C A 1925 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I 

GT CTT C CCAT AAT CACNAAGACAAGAAGG GAGT GAT T C GGGAAAGT T AC CT CAAAGGC C A 2591 

CGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGG 1985 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

CGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGG 2651 

GGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGC 2045 

I I I I I I I I I I M I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGC 2711 

TGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGT 2105 
I M I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGT 2771 

CAC CAAGCT CAG C G GC CT CT T TGGGGACACT CAAT C CAAAGAC CCAAAGC C GGAGGC C AT 2165 

I I I I I I I I I I I I I I I I M II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCC7WVGACCCAAAGCCGGAGGCCAT 2 8 31 

CCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCT 2225 
I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
CCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCT 28 91 

CAT TAAAGC AGACC AGC AC CAC CT GGAC CT GACGGC C CT C C C CAC C C CAGAGT CAAC C C C 22 85 

I I II I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I 

CAT T AAAGCAGAC CAGCAC CAC C T G GAC C T GAC GGCCCTCCC CAC C C CAGAGT CAAC C C C 2951 

AAC GCT GCAGCAGAAGC G GAAGC C CAGC C GC GG C AGC CGC GAGT G GGAGAGGAAC C AGAA 2345 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I II I I I I I I M I M I I I I I I 

AAC GCT G CAGCAGAAG C GGAAN C C CAGC C G C GGCAN C CGC GAGT GG GAGAG GAAC C AGAA 3011 

2346 CCT CAT CAAT GC CT GC ACAAAGGACAT GC C C C C CAT GGG CT C CC CT GT GAT T C CCAC GGA 24 05 







I I 1 1 1 1 1 1 II ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 








C CT CAT CAAT G C CT GCAC AAAGGACAT GC CC C C CAT GGGCTCCCCTGT GATT C C C ACG GA 


3071 


Qy 


2406 


CCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCA 


2465 




I I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 




rcTarrc rTGCGGGccTccrcc AGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCA 


3131 


Qy 


2466 


GCAGGGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAGATGGC 


2525 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 




UD 


"31 ^9 


rr APT HPT ATP A^rATnAr^TArCTGG ACC AGCCCAAAATGAGCGAGGTGGCCCAGATGGC 


3191 


Qy 


2526 


GCTGGAGGACCAGGCCGCCACACTGGAGTATAAGACCATCAAGGAACATCTCAGCAGCAA 


2585 




1 I I I I I I II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




UD 




rr*vrr~b>cc txcct^CCCC CCC AT ArTnrcAHT AT AAGACCATC A AGGAACATCTCAGCAGCAA 


3251 


Qy 


2586 


GAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAAGTTCC 


2645 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




UD 


onto 


rarTrrr a Arr ATr;nnr;Tr;A ArrTTnTt^GAGAACCTGGACAGCCTGCCCCCCAAAGTTCC 


3311 


Qy 


2646 


ACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAA 


2705 




1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


±Z 


z\ r* z\ r r* r* rr a r r fMT r r* rTnnnTrrr r r nrcrc AGC CT r r CT GT CT C AGACC GGT CTAAGCAA 


3371 


Qy 


2706 


GCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCAC 


2765 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DO 


oo /Z 




3431 


Qy 


2766 


GAACTCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTAACTCCTC 


2825 




I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




UD 




raiirTrrrTr arr Arc a anrr ArrAnnrrACCACTCTCAAAAGAAACAACACTAACTCCTC 


3491 


Qy 


2826 


CAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGC 


2885 




M I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 






3551 


Qy 


2886 


CCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGAC 


2945 




I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


"3 ^ S9 


rrrrr at nrzaczTCCl AfTrrATrrAGGTGC AC AGCTCCCAGCCATCTGGCCAGGCCGTGAC 


3611 


Qy 


2946 


TGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCG 


3005 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 




JJD 


^£1 9 


TPTrTrGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCG 


3671 




jUUO 


T ArrrrrTrrcrT A A Arrrrrr^ACGT ACCCCCC A A ACCATCCTTTGCTCCCCTTTCCACATC 


3065 




1 1 1 1 M 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3672 


TACGCCCTCGCTAAAGCCGGACGTACCCCCCA7\ACCATCCTTTGCTCCCCTTTCCACATC 


3731 


Qy 


3066 


CAT GAAGCCCAAT GATGCGT GTACATAA 3093 




Db 


3732 


1 II 1 1 1 1 1 1 1 1 1 I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 

CAT GAAGC C CAAT GAT GC GT GTACATAA 3759 





RESULT 7 
AX884099 

LOCUS AX884099 6060 bp DNA linear PAT 17-DEC-2003 

DEFINITION Sequence 19004 from Patent EP1074617. 
ACCESSION AX884099 



VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



CDS 



AX884099. 1 GI: 40039000 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Ota,T., Isogai,T., Nishikawa, T . , Hayashi,K., Saito,K., Yamamoto, J . , 
Ishii,S., Sugiyama,T. f Wakamatsu, A. , Nagai,K. and Otsuki,T. 
Primers for synthesising full-length cDNA and their use 
Patent: EP 1074617-A 19004 07-FEB-2001; 
Research Association for Biotechnology (JP) 

Location/Qualifiers 

1. .6060 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
89. .1345 

/note- "unnamed protein product" 
/codon__start=l 
/protein_id="CAE92227 .1" 
/db_xref="GI: 40039001" 

/ trans la tion="MIMNGTLYIAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQADVD 
TCRMKGKHKDECHNFIKVLLKKNDDALFVCGTNAFNPSCRNYKMDTLEPFGDEFSGMA 
RCPYDAKHANVALF.ADGKLYSATVTDFLAIDAVIYRSLGESPTLRTVKHDSKWLKEPY 
FVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSFLKA 
RLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDMLDIAS 
VFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLERYATSNEFPDDTLNFIKTH 
PLMDEAVP S I FNRPWFLRTMVRYRLTKI AVDTAAGP YQNHTWFLGS EKGI I LKFLAR 
IGNSGFLNDSLFLEEMSVYNSEKMQL" 



ORIGIN 



Query Match 96.0%; 
Best Local Similarity 99.8%; 
Matches 2994; Conservative 



Score 2969.6; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 6060; 

4; Indels 2; Gaps 



2; 



Qy 



Db 



96 CAACTATACAAAACAGTATCCGGTGTTTGTGGGCCACAAGCCAGGACGGAACACCACACA 155 

I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1 C AACT AT ACAAAAC AGT AT C C G GT GT T T GT GGGC C AC AAGC C AGGAC G GAAC AC C AC AC A 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



156 GAGGCACAGGCT GGACATC CAGATGATTAT GAT CAT GAACGGAACCCTCTACATT GCT GC 215 
I I I I I I II I I I I I I I I I I I I I I I I II II II II I I I I II I I II I I I I I I I I I I I I I I I I I 
61 GAGGCACAGGCT GGACAT CCAGGTGATTAT GAT CAT GAACGGAACCCTCTACATT GCTGC 120 

216 TAGGGAC CAT ATT TAT ACT GT T GAT AT AGACACAT CACACACGGAAGAAAT T TAT T GT AG 275 

I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

121 TAGGGAC CAT AT T TAT ACT GT T GAT AT AGACACAT C AC AC AC GGAAGAAAT T T ATT GT AG 180 

276 CAAAAAACT GAC AT GGAAAT C TAGACAGGC C GAT GTAGACACAT GCAGAAT GAAGGGAAA 335 

I II I M M I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I I I I 

181 CAAAAAACT GACAT GGAAAT CTAGACAG GC C GAT GTAGACACATGCAGAAT GAAGGGAAA 240 

336 ACAT AAGGAT GAGT GCCACAACTTTATTAAAGTT CTT CTAAAGAAAAACGAT GAT GCATT 395 

II II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I 

241 ACAT AAGGAT GAGT GCCACAACTTTATTAAAGTT CTT CTAAAGAAAAACGAT GAT GCATT 300 



Qy 



396 



GTTTGTCT GTGGAACTAAT GCCTTCAACCCTT CCT GCAGAAACTATAAGAT GGATACATT 455 



Db 


301 


GTT T GT CT GT GGAACT AAT GC CT T CAAC C CT T C CTG C AGAAACT AT AAGAT GGAT AC ATT 


360 


Qy 


456 


GGAACC AT T C GGGGAT GAAT T CAGCG GAAT GGC CAGAT G C C CAT AT GAT G C CAAAC AT GC 


515 




l 1 1 1 1 1 t 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 l l l I f I I I i i i 1 1 




Db 


361 


GGAAC C ATT C GGGGAT GAATT C AGCGGAAT G GC CAGAT GC C CAT AT GAT GC CAAAC AT GC 


420 


Qy 


516 


CAAC GT T GC ACT GT T T GCAGAT G GAAAACT AT ACTC AGC C ACAGT GACT GACT T CCT T G C 


575 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
M 1 1 1 1 I 1 1 1 1 M 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 I I I I i i i i i i 




Db 


421 


CAAC GTT GC ACT GTTT GCAGAT GGAAAACT AT ACTC AGC CACAGT GACT GACTT CCTT GC 


480 


Qy 


576 


CAT T GACGC AGT CATT TACC GGAGT CT T G GAGAAAG C C CT AC C CT GC GGAC C GT CAAGC A 


635 




I I t I i I I I l l l l l 1 1 1 1 l l l l l 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l I I i I I I I I 




Db 


481 


CAT T GAC GC AGT C AT TT AC C GGAGT CT T G GAGAAAGC CCT AC CCT GC GGAC C GT CAAGC A 


540 


Qy 


636 


CGATT CAAAATGGTT GAAAGAACCATACTTT GTT CAAGCCGT GGATTACGGAGATTATAT 


695 




i i i t i i i i i i i 1 M 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
M 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 l l l I i I I I I I I I I 




Db 


541 


CGAT T CAAAAT GGT T GAAAGAAC CAT ACT TT GT T CAAGC C GT GGAT T AC GGAGATT AT AT 


600 


Qy 


696 


CT ACTT CTT CTT CAGGGAAATAGCAGTGGAGTATAACACCAT GGGAAAGGTAGTTTT CCC 


755 




i i i i i i i i i i i i i i i i i i i i i I I I I I I I I I I I 1 I I I I I I l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 i 1 1 1 1 




Db 


601 


CT ACT T CTT CTT CAG GGAAAT AG C AGT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T C C C 


660 


Qy 


756 


AAGAGT GG CT CAGGT TT GT AAGAAT GAT AT GGGAGGAT C T CAAAGAGT C CT G GAGAAAC A 


815 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I II 1 I 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


AAGAGT GGCT CAGGT T T GT AAGAAT GAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAAC A 


720 


Qy 


816 


GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 


875 




i i i i i i i t i i i i i i i i i i I I I l l l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 


780 


Qy 


876 


TT T CAACAT T CT C CAG GC AGTT ACAGAT GT GATT C GT AT CAAC GG GC GT GAT GTT GT C CT 


935 




i i i i i i i i i I I i I I l l l l l l l l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I 




Db 


781 


T T T CAACAT T CT C CAGGCAGT T ACAGAT GT GAT T C GT AT CAAC GGGCGT GAT GTT GT CCT 


840 


Qy 


936 


G GCAAC GT T TT CT AC AC CT T AT AAC AGC AT C C CT GG GT CT GC AGT CT GT GCCTAT GAC AT 


995 




1 1 1 1 I ! 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 M 1 1 M 1 M 1 1 M 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 




Db 


841 


GGCAACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACAT 


900 


Qy 


996 


GCT T GACAT T GC CAGT GT T TT T ACT GGGAGAT T CAAGGAACAGAAGT CT CCT GAT T CC AC 


1055 




i i i i i I I I I I I I I I ! I I l l l l l 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 t 1 1 1 1 
1 1 M 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I t I I I 




Db 


901 


GCT T GACAT T GC CAGT GT T TT T ACT G GGAGAT T CAAGGAACAGAAGT CT C CT GAT T CC AC 


960 


Qy 


1056 


CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 


1115 




i i i i I I I I I I I i I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 IE 1 1 
I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l l l I I I I I i I I I I 




Db 


961 


CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 


1020 


Qy 


1116 


AT CC T CC T T AGAAAGAT AT GCAAC CT CCAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT 


1175 




I I I l l l l l l l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 l l I I I I i i i i i i i i i i i 




Db 


1021 


AT CCT C CT T AGAAAGAT AT GCAAC CT C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT 


1080 


Qy 


1176 


CAAGACGCACCCGCTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCT 


1235 




1 1 I 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


1081 


CAAGACGCACCCGCTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCT 


1140 


Qy 


1236 


G AGAACAAT G GT C AGAT ACC G C CT TAC CAAAATT G C AGT GGACACAGCT GCT GG GC C AT A 


1295 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 





Db 1141 GAGAACAAT GGT CAGAT AC C GC CT T AC CAAAATT GCAGT G GACACAGCT GCT GGGC C AT A 1200 

Qy 1296 T CAGAAT CAC AC T GT GGT T T T T CT G GGAT C AGAGAAGGGAAT CAT CT T GAAGTT T T T G GC 1355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1201 T CAGAAT CAC AC T GT GGT T T T T CT G GGAT CAGAGAAGGGAAT CAT CT T GAAGTT T T T G GC 1260 

Qy 1356 CAGAAT AGGAAATAGT G GT T T T CT AAAT GACAGC CT T T T C CT GGAGGAGAT GAGT GTT TA 1415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 CAGAAT AG GAAATAGT GGT T T T CTAAAT GAC AGC CT T T T C CT GGAGGAGAT GAGT GT T T A 1320 

Qy 1416 CAACT CT G- AAAAAT GC AGCTAT GAT GGAGT C GAAGACAAAAGGAT C AT GGG CAT GC AGC 1474 

MINIM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1321 CAACT CT GAAAAAAT GCAGCT AT GATG GAGT C GAAGACAAAAGGAT CAT G G GCAT GC AGC 138 0 

Qy 1475 T GGACAGAGCAAG C AGCT CT CT GT AT GT T GC GTT CT CT AC CT GT GT GAT AAAGGT T C C C C 1534 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 1440 

Qy 1535 TTGGCCGGTGTGAACGACATGGGAAGTGT-AAAAAAACCTGTATTGCCTCCAGAGACCCA 1593 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T T G G C C G GT GT GAAC GAC AT GGGAAGT GT AAAAAAAAC CT GT AT T GC CT C C AGAGAC C CA 1500 

Qy 1594 TAT T GT GGAT GGAT AAAGGAAGGT GGT GCCT GCAGCCATTT ATCACCCAACAGCAGACTG 1653 

I M I I I I I II I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 1501 TATT GT GGAT GGAT AAAGGAAGGT GGT GCCT GCAGCCATTTAT CACCCAACAGCAGACTG 1560 

Qy 1654 ACT T T T GAGC AGGACAT AGAGCGT GG CAAT ACAGAT G GT CT GGG GGACT GT CACAATT CC 1713 

I M I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1561 ACTTTT GAGCAGGACAT AGAGCGT GGCAATACAGATGGTCT GGGGGACTGT CACAATT CC 162 0 

Qy 1714 T TT GT GG CACT GAAT G GG C AT TCC AGT T CCCTCTTGCC CAGCACAAC CAC AT CAGAT T CG 1773 

I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 1621 T TT GT G GCAC T GAAT GGG CAT T CT AGT TCCCTCTTGCC CAGCACAAC CAC ATC AGATT CG 168 0 

Qy 1774 AC GG CT CAAGAGG GGT AT GAGTCT AGGG GAGGAAT GCT GGACT GGAAG CAT CT G CTT GAC 1833 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1681 ACGGCT CAAGAGGGGTATGAGTCTAGGGGAGGAAT GCT GGACT GGAAGCAT CTGCTTGAC 1740 

Qy 18 34 T C ACCT GACAGC ACAGACC CT TT GGGG GCAGT GT C T T C C C AT AAT CAC CAAGACAAGAAG 18 93 

I I I I I I I I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 17 41 T CAC CT GACAGC ACAGACC CT T T G GG GGCAGT GT CT T C C CAT AAT CAC CAAGACAAGAAG 18 00 

Qy 18 94 GGAGTGATT C GGGAAAGTT ACCT CAAAGGC CAC GAC C AGCT GGT T C C C GT CAC C CT CT T G 1953 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M 
Db 18 01 GGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTG 18 60 

Qy 1954 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 2 013 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 1 I I I I I I 

Db 1861 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 1920 

Qy 2014 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 207 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 1980 

Qy 2074 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 
Db 1981 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2040 



Qy 


2134 


ACT CAAT C CAAAGAC C CAAAG C C G GAGGC CAT C CT C AC GC CACT C AT GC ACAACG GCAAG 


2193 




1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 

1 1 | | 1 | | 1 1 M 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 M I I I 1 I 1 I I i i i 




Db 


2041 


ACT CAAT C C GAAGAC C CAAAGC C GGAGGC CAT C CT CAC G C CACT CAT GCACAACGG CAAG 


2100 


Qy 


2194 


CT CGC CACT CC C GGCAAC AC G GC CAAGAT GCT CAT TAAAG C AGAC CAGC ACCACC T GGAC 


2253 




1 1 1 1 1 1 II 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 ! 1 I 1 1 1 
1 1 1 1 1 1 I 1 1 1 1 1 1 I I I I I i i i i i i i i i i i i i > i i i i i i i i i i i i i i i i i i i i i i i i i > ■ 




Db 


2101 


C T CGC CACT CC CG GCAACACGGC CAAGAT GCT CAT T AAAGC AGACTAGC AC CACCT GGAC 


2160 


Qy 


2254 


CTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGC 


2313 




1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M I 1 1 1 1 1 1 1 1 1 l l l l l 1 1 1 l l l l l l I I I I I I I M i ii ii 




Db 


2161 


C T GAC GGC C CT C C C CAC C CCAGAGT CAAC CCCAAC GCT GCAGC AGAAGC GGAAG C C CAG C 


2220 


Qy 


2314 


CGCGGCAGCCGCGAGT GGGAGAGGAACCAGAACCT CAT CAAT GCCT GCACAAAGGACAT G 


2373 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I I 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l i l l l I I I I I I I I I I I i i i i i i i i i i i i i i i < 




Db 


2221 


C GCGGCAGC C G C GAGT G GGAGAGGAACC AGAAC CT CAT CAAT GCCT GCACAAAGGACAT G 


2280 


Qy 


2374 


CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 


2433 




I I I I II II 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I I 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 l 1 I i s I 




Db 


2281 


CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 


2340 


Qy 


2434 


AT C C C CAGCGT GGT G GT C CT GC CC AT CAC GCAGC AG G G CTAC CAGCAT GAGT AC GT GGAC 


2493 




I I I I I l l l l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l l l l l l I I I t I I i i i i i i i f i i i i 




Db 


2341 


AT C C C CAG CGT G GT GGT C CT G C CCAT CAC GCAGC AGGGCT AC CAGCAT GAGTAC GT GGAC 


2400 


Qy 


2494 


CAGC C CAAAAT GAGC GAGGT GGC C CAGAT GGC GC T GGAGGAC CAG GC C GC C ACACT GGAG 


2553 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 I 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 I 1 
I I I I I I I 1 II 1 1 1 II 1 I I I I I 1 I l l I I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


2401 


CAGC C CAAAAT GAGC GAG GTGGCC CAGAT GGCGCT GGAGGAC CAGGCCGCC ACACT GGAG 


2460 


Qy 


2554 


T AT AAGAC CAT CAAGGAACAT CT CAGC AGCAAGAGT C C CAAC CAT GG G GT GAAC CT T GT G 


2613 




i I I I I I I l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 M 1 1 1 1 
I 1 1 1 1 1 1 M II 1 1 1 1 1 1 II 1 1 1 1 1 I 1 1 II l l l l l i l l ll l I I I I I I i i i i i i i i i i i i i i 




Db 


2461 


TAT AAGAC CAT CAAGGAACAT CT CAGC AGCAAGAGTCC CAAC CAT GGGGT GAACCTT GT G 


2520 


Qy 


2614 


GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 


2673 




1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 E M 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 1 
I I I I j I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I I I I i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


2521 


GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 


2580 


Qy 


2674 


GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 


2733 




I l I l l l l l l l l l 1 1 1 i 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 t 1 I 1 
I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I i I 1 1 1 1 1 i i i i i i i i i i i i i i i i i i i i i i i 




Db 


2581 


GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 


2640 


Qy 


2734 


T AC GGGGT T GACT AT AAGAG GAG CTAC C C CACGAACT C GCT CAC GAGAAGC CAC CAGGCC 


2793 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 t 1 1 1 I 1 1 I 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l l l l ll l I I I I i t i i i i i i i i i i i i i i ii i i i i i i i i i i i i i i i 




Db 


2641 


T AC GGGGT T GACT AT AAGAGGAG C T AC C C CACGAACT C GCT CAC GAGAAG C CAC CAGGCC 


2700 


Qy 


2794 


AC C ACT C T CAAAAGAAACAACACT AACT C CT CCAAT T C CT CT CACCT CT C CAGAAAC CAG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 IE 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


2853 


Db 


2701 


I I 1 1 M 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l l i i i i i i i ii i i ii i i > i ii i ii ii i ii i 

AC CAC T CTCAAAAGAAACAACACT AACT C CT CCAAT T C CT CT CACCT CT C CAGAAAC CAG 


2760 


Qy 


2854 


AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 


2913 




I | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 I 1 1 1 1 M 1 1 1 1 1 1 




Db 


2761 


AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 


2820 


Qy 


2914 


CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 


2973 




I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


2821 


CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 


2880 



2974 TACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCC 3033 

I I I I I I I II II I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

28 81 TACAACT CACT GACAAG GT C GGG G CT GAAG C GT AC G C C CT C GC TAAAGCC G GAC GTAC CC 2940 

3034 CCCAAACCATCCTTTGCTCCCCTTTCCACATCCATGAAGCCCAATGATGCGTGTACATT^A 3093 

I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I 

2941 C C CAAAC CAT CCTTTGCTCCCCTTTC C ACAT CC AT GAAGC C CAAT GAT GC GT GT ACATAA 3000 



RESULT 8 
BD160721 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 



COMMENT 



BD160721 6060 bp DNA linear PAT 17-JAN-2003 

Primer for synthesizing full-length cDNA and use thereof. 
BD160721 

BD160721. 1 GI: 278 6647 9 
JP 2002191363-A/15564. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 6060) 

Ota,T., Isogai,T., Nishikawa, T . , Hayashi,K., Saito,K., Yamamoto, J . , 
Ishii,S., Sugiyama,T., Wakamatsu,A. , Nagai,K. andOtsuki,T. 
Primer for synthesizing full-length cDNA and use thereof 
Patent: JP 2002191363-A 15564 09-JUL-2002; 
HELIX RESEARCH INSTITUTE 



FEATURES 

source 



ORIGIN 



OS 


Homo sapiens (human) 




PN 


JP 2002191363-A/15564 




PD 


09-JUL-2002 




PF 


28-JUL-2000 JP 2000280990 




PI 


TOSHIO OTA, TAKAO I SOGAI , TETSUO 


NISHIKAWA, KOJI HAYASHI , KAORU 


PI 


SAITO, 




PI 


JUNICHI YAMAMOTO, SHI ZUKO I SHI I, 


TOMOYASU SUGIYAMA,AI WAKAMATSU, 


PI 


KEIICHI NAGAI, TETSUJI OTSUKI 




PC 







C12N15/09,C07K14/47,C07K16/18, C12N1/15, C12N1/19, C12N1/21, C12N5/ PC 
10, 

PC C12P21/02,C12Ql/68//C12P21/08,G06F17/30,C12N15/00,Cl2N5/00 CC 
Primer for synthesizing full-length cDNA and use thereof FH Key 
Location/Qualifiers 
FT CDS (89) . . (1342) . 

Location/Qualifiers 
1. .6060 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db xref="taxon: 9606" 



Query Match 96.0%; Score 2969.6; 

Best Local Similarity 99.8%; Pred. No. 0; 
Matches 2994; Conservative 0; Mismatches 



DB 6; Length 6060; 



4; Indels 



2; Gaps 



2; 



QY 
Db 



96 C AAC TAT ACAAAACAGT AT CC GGT GT TT GTGGGC CACAAGC CAGGACGGAACACCACACA 155 

M I I I I I I I I I I I I I M I I I I M I I I I M I M I I I I II I I I I I I I I I I M I I I I I I I M I 

1 CAACT AT ACAAAACAGT AT C C GGT GT T T GT G G GC CACAAGC CAGGAC GGAACAC CACACA 60 



156 GAGG CAC AGGCT G GACAT C C AGAT GAT TAT GAT CAT GAACG GAAC CCT CT ACAT T GCT GC 215 



Db 


61 


Qy 


216 


Db 


121 


Qy 


276 


Db 


181 


Qy 


336 


Db 


241 


Qy 


396 


Db 


301 


Qy 


456 


Db 


361 


Qy 


516 


Db 


421 


Qy 


576 


Db 


481 


Qy 


636 


Db 


541 


Qy 


696 


Db 


601 


Qy 


756 


Db 


661 


Qy 


816 


Db 


721 


Qy 


876 


Db 


781 


Qy 


936 


Db 


841 


Qy 


996 



I I I I I I I I I II M I I I I I II I I I I I I I I I I I I I I I II Ill II I I I I II I 

GAGGC AC AG GCT G GACAT C CAGGT GAT TAT GAT CAT GAAC GGAAC C CT CT AC ATT G CT G C 120 
TAGGGACCATATTTATACT GTT GAT AT AG AC AC AT CACACAC GGAAGAAATTTATT GTAG 275 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I 

TAGGGACCATATTTATACTGTT GAT AT AGACACAT CACACACGGAAGAAATTTATT GTAG 18 0 

CAAAAAACT GACAT GGAAAT CT AGACAG GC CGAT GT AGACAC AT GCAGAAT GAAGG GAAA 335 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAAAAACT GACAT G GAAAT CT AGACAGGC C GAT GT AGACAC AT GCAGAAT GAAG G GAAA 24 0 

AC AT AAGGAT GAGT GC CACAAC TTT AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T 395 

I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I M I 

AC AT AAGGAT GAGT GC CACAACT T T ATT AAAGT T CT T CTAAAGAAAAAC GAT GAT G CAT T 300 
GT T T GT CT GT GGAACT AAT GC C T T CAAC C CT T C CT GCAGAAACT AT AAGAT GGAT AC AT T 4 55 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I 

GT TT GT CT GTGGAACTAAT GC CT T CAAC C CT T C CT GCAGAAACT AT AAGAT GGAT ACAT T 360 
GGAAC CATT CGGGGATGAATT CAGCGGAATGGCCAGAT GCCCATAT GAT GC CAAACAT GC 515 

I I I I I I I I I I I I I I I I I I i I I I I II I I I I I I I I I I I II I I I I I I I II M I I I I I I I I I I I 

GGAAC CATT CGGGGATGAATT CAGCGGAATGGCCAGATGCCCAT AT GAT GCCAAACAT GC 420 

CAACGTTGCACTGTTTGCAGATGGAAAACTATACTCAGCCACAGTGACTGACTTCCTTGC 57 5 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAAC GTT GCACT GT T TGCAGAT GGAAAACT ATACT CAGC C ACAGT GACT GACT T CC TT GC 4 80 

C ATT GAC GCAGT CAT TT AC C GGAGT CT T G GAGAAAGC C CT AC C CT GCGGAC C GT CAAGCA 635 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M 

CATT GAC G CAGT CATTT AC C GGAGT CT T GGAGAAAGC CCT AC CCT GC G GAC C GT CAAGCA 540 

CGATT CAAAATGGTT GAAAGAACCATACTTT GTT CAAGCCGT GGATTACGGAGATTAT AT 695 

I I I M | I II I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I II 

C GAT T CAAAAT GGT T GAAAGAAC CAT ACTTT GTT CAAGCC GT GGATT AC GGAGAT TAT AT 600 

CTACTTCTTCTTCAGGGAAATAGCAGTGGAGTATAACACCATGGGAAAGGTAGTTTTCCC 755 

I | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I II I I I I I I I I 

CT ACT T CT T CT T CAGGGAAAT AGCAGT G GAGTAT AAC ACC AT G GGAAAG GT AGTT T T C C C 660 

AAGAGT GG CT CAGGT T T GT AAGAAT GAT AT G GGAGGAT CT CAAAGAGT CCT GGAGAAACA 815 

I I I I II I I I II I I M I I I I I I I I I I I I I II I I I I II I I I I II I I I II I I II I I I I I I I I I 

AAGAGT GGCT CAGGTTT GT AAGAAT GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACA 720 

GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 875 

M I I I I I I I I I I II I I I I I I M I I I I II I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I 

GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 780 

T TT CAAC AT T CT C C AG GCAGT T AC AG AT GT GAT T CGT ATCAAC GG GC GT GAT GT T GT C CT 935 

I I I I I II I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTT CAACAT T CTC C AGG CAGT T ACAGAT GT GAT T C GT AT CAAC GGGC GT GAT GT T GT C CT 840 

GGCAACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACAT 995 

I | | | II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

GGCAACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACAT 900 

GCT T GACAT T GC CAGT GTT T TT ACT GGGAGATT CAAG GAACAGAAGT CT C CT GATT C C AC 1055 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



DD 




PPTTPAPATTPPPAPTPTTTTTAPTPPPAPATTCAAGGAACAGAAGTCTCCTGATTCCAC 


960 


Qy 


1056 


CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 


1115 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




DD 


z? D ± 


PTPPAPAPPAPTTPPTPATPAAPPAPTTPPTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 


1020 


Qy 


1116 


ATCCTCCTTAGAAAGATATGCAACCTCCAATGAGTTCCCTGATGATACCCTGAACTTCAT 


1175 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1UZ1 


7\Tr*r M T , r , r* r n r rzir*a fl arziTQTrr ziZiPPTrr* A QT^AnTTrrrTf^ATnAT A P PPT PA APTTPAT 


1080 


Qy 


1176 


CAAGACGCACCCGCTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCT 


1235 




1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


1 n p i 
lUol 


r* a at appp APPPPPTP ATPP ATPAPPPAPTPPPPTPP ATPTTPAAPAPPPPATGGTTCCT 


1140 


Qy 


1236 


GAGAACAATGGTCAGATACCGCCTTACCAAAATTGCAGTGGACACAGCTGCTGGGCCATA 


1295 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


r* 7\ r* 7\ Ap7\ Am^r^r* ar 1 A r rar , r , r < f~ < r*TT APP A A A ATTPPAPTPPAP AP APPTPPTPPPPPATA 


1200 


Qy 


1296 


TCAGAATCACACTGTGGTTTTTCTGGGATCAGAGAAGGGAATCATCTTGAAGTTTTTGGC 


1355 




1 I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


lzUl 


mp a 7\rnr , 2\r*7\ r ,r Pr ,r rr , r" r PTTTTr , TPPP ATP APAPA APPPA ATP ATPTTPAAPTTTTTPPP 


1260 


Qy 


1356 


CAGAATAGGAAATAGTGGTTTTCTAAATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTA 


1415 




1 I I I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


Izbl 


r*7\r , 7\7\ r P7\r , r , T^ naTarTrPTTTTrTZiZi A'TP A A r* fPTTTT PPT PP APP AP ATP APT PTTT A 


1320 


Qy 


1416 


CAACTCTG-AAAAATGCAGCTATGATGGAGTCGAAGACAAAAGGATCATGGGCATGCAGC 


1474 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 O O 1 
13Z 1 


r , 7\7\r ,r rr ,r T i r , AA A7\7\n r Prrz\fT'TZ\Trz\TrrArTr , CA Afzar A Z\ A APPATP ATPPPP ATPP APP 


1380 


Qy 


1475 


TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 


1534 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Dfc> 


loo 1 


t< r r a r a r a r r a a r r* A rrTPT PT PT AT PTT PP PTT PT PT A P PT PT PT PAT A A APPTT P P P P 


1440 


Qy 


1535 


TTGGCCGGTGTGAACGACATGGGAAGTGT-AAAAAAACCTGTATTGCCTCCAGAGACCCA 


1593 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1/1/11 
1441 


r r r T"rrrprr , Tr f rr , a arrnrATrrra arTrT a A A A A A A APPTPT ATTPPPTPP APAPAPPP A 


1500 


Qy 


1594 


TATTGTGGATGGATAAAGGAAGGTGGTGCCTGCAGCCATTTATCACCCAACAGCAGACTG 


1653 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


lOU 1 


t» at"! 1 nrrATrr at a a arr a APPTPPTPPPTPP APPPATTT ATP APPPA AP APP AG APT G 


1560 


Qy 


1654 


ACTTTTGAGCAGGACATAGAGCGTGGCAATACAGATGGTCTGGGGGACTGTCACAATTCC 


1713 




I 1 1 M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


IjdI 


TV p. rp rp rp rp tv /-< p t\ ^ t\ ^ a rn t\ p a r* r r*TP PP A AT AP A PAT PPT PT PPPPP A PT PTP AP A ATTCC 
/\U 1 1 1 1 bnb^nbbnbnl rvbnb^b 1 ^kj^r\rVX f\\->s\\3f\ 1 uoi ^1 ijuUuUAV/ X w x x \_- 


1620 


Qy 


1714 


TTTGTGGCACTGAATGGGCATTCCAGTTCCCTCTTGCCCAGCACAACCACATCAGATTCG 


1773 




1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


1 bz 1 


mmmpmp^pTi^m("j7\mr l ^pp ATT PT A PTT PP PT PTT PP P P APP A P A APP AP AT CAGATTCG 


1680 


Qy 


1774 


ACGGCT CAAGAGGGGTAT GAGT CTAGGGGAGGAAT GCT GGACT GGAAGCATCT GCTTGAC 


1833 




I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1681 


ACGGCTCAAGAGGGGTATGAGTCTAGGGGAGGAATGCTGGACTGGAAGCATCTGCTTGAC 


1740 


Qy 


1834 


T CAC CT GACAGCAC AGAC C CT T T GGGGGCAGT GT CTT C C C AT AAT C AC CAAGAC AAGAAG 


1893 




I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


T CAC CT GACAGCAC AGAC CCTTTGGGGG CAGT GT CT T C C CAT AAT CAC CAAGACAAGAAG 


1800 



Qy 


1894 


Db 


1801 


Qy 


1954 


Db 


1861 


Qy 


2014 


Db 


1921 


Qy 


2074 


Db 


1981 


Qy 


2134 


Db 


2041 


Qy 


2194 


Db 


2101 


Qy 


2254 


Db 


2161 


Qy 


2314 


Db 


2221 


Qy 


2374 


Db 


2281 


Qy 


2434 


Db 


2341 


Qy 


2494 


Db 


2401 


Qy 


2554 


Db 


2461 


Qy 


2614 


Db 


2521 


Qy 


2674 


Db 


2581 



GGAGT GAT T C G GGAAAGTTAC CT CAAAG GC CAC GACC AGCT G GT T CC C GT C AC C CT CT T G 1953 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I 

GGAGT GAT T C GGGAAAGT T AC CT CAAAGGC CAC GACCAGCT GGT T C C C GT CAC C CT CT T G 1860 

GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 2013 

I I I I I I I I I II I I I I I II I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I 

GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 1920 

TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 2073 
I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 198 0 

ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 204 0 

ACT CAAT CCAAAGACC CAAAGC C GGAGGC CAT C CT C AC GC C ACT CAT GC ACAAC GGCAAG 2193 
I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACT CAAT CC GAAGAC C CAAAGC C GGAGGC CAT C CT C AC G C CAC T CAT GC ACAAC GGCAAG 2100 

CT CGCCACT CCCGGCAACAC GGC CAAGAT GCTCATTAAAGCAGACCAGCACCACCT GGAC 2253 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT C GC CACT C CC G GCAACAC GGC CAAGAT GCT C ATT AAAGCAGACT AGC AC CAC CT GGAC 2160 

CTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGC 2313 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I II I I II I I I I I I I 

CT GAC GGC C CT C C C C AC CC CAGAGT CAAC C CCAACG CTGCAGC AGAAGCGGAAGCC CAGC 2220 

C GC GG C AGC C GC GAGT GGGAGAG GAAC CAGAACCT C AT CAAT GC CT GCACAAAGGACAT G 2373 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C GC GGCAG C C G C GAGT GGGAGAGGAAC C AGAAC CT C AT CAAT G C CT GCACAAAGGACAT G 2280 

CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 2433 

I | | | | | | | I I II II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 234 0 

ATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGAC 24 93 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGAC 2400 

CAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGAG 2553 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 

CAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGAG 2460 

TATAAGACCAT CAAGGAACATCT CAGCAGCAAGAGT CCCAACCAT GGGGT GAACCTTGT G 2 613 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T AT AAGAC CAT CAAGGAACAT CT CAG CAGCAAGAGT C C CAACC AT G GGGT GAACCT T GT G 2520 

GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 2673 

M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 2580 

GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 2733 

I | | M II I I I I II I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 2640 



Qy 

Db 



2734 
2641 



T ACGGGGT T GACT AT AAGAGGAGCT ACC C CAC GAACT C GCT CAC GAGAAGC C AC C AGGC C 

I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

T ACG GG GT T GACT AT AAGAGGAGCT AC C C CAC GAACTC GCT CAC GAGAAGC CAC C AGGC C 



2793 
2700 



Qy 


2794 


AC CACT CT C AAAAGAAACAAC ACT AACT C CT C CAAT T C CT CT CAC CT C T CCAGAAAC C AG 


2853 




II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




UD 


97 n i 

Zl / U _L 


ATP APTCTC AAAAGAAACAAC ACT AACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAG 


2760 


Qy 


2854 


AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 


2913 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




DD 


Z / Di 


arrTTTrxrA^r^r.AnArAArTrGfrGrrCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 


2820 


Qy 


2914 


CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 


2973 




I M 1 1 1 1 1 I | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2821 


CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 


2880 


Qy 


2974 


TACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCC 


3033 




I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


2881 


TACAACT CACT GACAAGGTCGGGGCTGAAGCGTACGCCCTC GCT AAAGCCGGACGTACCC 


2940 


Qy 


3034 


C C CAAAC CAT C CTT T GCT C C C C TT T CC ACAT C CAT GAAGC C CAAT GAT GC GT GT ACAT AA 


3093 




1 I I I 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2941 


CCCAAACCATCCTTTGCTCCCCTTTCCACATCCATGAAGCCCAATGATGCGTGTACATAA 


3000 
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University of Tokyo. 
FEATURES Location/Qualifiers 
source 1 . .6060 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone="PLACE4 000230" 

/ tissue__type="placerita" 

/clone_lib="PLACE4" 

/note= M cloning vector: pME18SFL3" 
CDS 89. .1345 

/note="unnamed protein product" 

/ codon_start=l 

/protein_id="BAB55418 .1" 

/db_xref="GI: 14042854" 

/ translation="MIMNGTLYIAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQADVD 
TCRMKGKHKDECHNFIKVLLKKNDDALFVCGTNAFNPSCRNYKMDTLEPFGDEFSGMA 
RCPYDAKHANVALFADGKLYSATVTDFLAIDAVIYRSLGESPTLRTVKHDSKWLKEPY 
FVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSFLKA 
RLN C S VP GD S H F Y FN I LQAVT D VI RI N G RD WLAT FSTPYNSIP G S AVCAY DML D I AS 
VFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLERYATSNEFPDDTLNFIKTH 
PLMDEAVPSIFNRPWFLRTMVRYRLTKIAVDTAAGPYQNHTWFLGSEKGIILKFLAR 
IGNSGFLNDSLFLEEMSVYNSEKMQL" 

ORIGIN 

Query Match 96.0%; Score 2969.6; DB 9; Length 6060; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 2 994; Conservative 0; Mismatches 4; Indels 2; Gaps 2; 

Qy 96 CAAC T AT ACAAAACAGT AT C C GGT GTT T GT GGGC CACAAGC CAGGAC GGAACAC CAC ACA 155 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CAACT AT ACAAAACAGT AT CCGGTGTTTGT GGGC CACAAGC CAG GAC G GAACAC CAC AC A 60 

Qy 156 GAGGCACAGG CT G GACAT C CAGAT GATT AT GAT CAT GAAC GGAACC CT CT ACAT T GCT GC 215 

I I I I II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I II I I I I I I II I I I I I I I I I 
Db 61 GAGGCACAG GCT GGAC AT C CAGGT GAT TAT GAT CAT GAAC GGAACC CT CT ACAT T GCT GC 120 

Qy 216 TAG GGAC CAT AT T TAT ACT GT T GAT AT AG ACAC AT C ACACACGGAAGAAATTT AT T GTAG 27 5 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TAGGGAC CATATTTATACT GTT GATATAGACACATCACACACGGAAGAAATTT ATT GTAG 18 0 

Qy 27 6 CAAAAAACT GACAT GGAAAT CT AGAC AGGC C GAT GT AGACACAT GC AGAAT GAAGGGAAA 335 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 181 CAAAAAACT GACAT GGAAAT CTAGACAGGCCGAT GT AGACACAT GCAGAAT GAAGGGAAA 240 

Qy 336 ACAT AAG GAT GAGT GC CACAACT TT AT TAAAGT T CT T CTAAAGAAAAAC GAT GAT GC AT T 395 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 241 ACAT AAGGAT GAGT GC CACAACT T TAT T AAAGTT CT T CTAAAGAAAAAC GAT GAT GCAT T 300 

Qy 396 GT T T GT CT GT GGAACTAAT GCCT T CAAC C CTT C CT GCAGAAACT ATAAGAT G GAT ACAT T 455 

I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GTT T GT C T GT GGAACTAAT G CCT T CAACC CTT C CT G CAGAAACTAT AAGAT GGAT ACATT 360 

Qy 456 G GAAC CAT T C G GGGAT GAAT T C AGC GGAAT GGCC AGAT GC CC AT AT GAT GC CAAAC AT GC 515 

I I I I I I II I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 361 GGAAC CAT T C GGGGAT GAAT T CAGC G GAAT GG C CAGATGC CC AT AT GAT G C CAAAC AT GC 42 0 



Qy 516 CAAC GT T GCACT GT TT GCAGAT G GAAAACTAT ACT C AG CCACAGT GACT GACTT C CT T GC 575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 421 CAAC GT T GCACT GT TT G CAGAT GGAAAACT AT AC T CAGCC ACAGT GACT GACT T C CT T GC 480 

Qy 57 6 CAT T GAC GC AGT C ATT T ACC GGAGT C TT GGAGAAAGC C CT ACC CT GC GGAC C GT CAAG C A 635 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 4 81 CAT T GAC GC AGT C ATT T AC C G GAGT CT T GGAGAAAGC C CT ACC CT GC GGAC C GT CAAG CA 54 0 

Qy 636 C GAT T C AAAAT G GT T GAAAGAAC CAT AC T T T GT T CAAG C C GT G GAT T AC G G AGAT TAT AT 695 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 C GATTCAAAAT GGTTGAAAGAACCATACTTT GTT CAAGCCGTGGATTACGGAGATTAT AT 600 

Qy 696 C TACTT CT T C T T C AGGGAAATAGC AGT G GAGT AT AACAC C AT GGGAAAGGT AGT T TT C CC 755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 
Db 601 C TACTT C T T C T T C AGGGAAATAGCAGT G GAGTAT AACAC CAT GGGAAAGGT AGT T TT C C C 660 

Qy 7 56 AAGAGT GGCT CAGGTTTGTAAGAATGATAT GGGAGGAT CT CAAAGAGT CCT GGAGAAACA 815 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 AAGAGT GGCT CAGGTTT GTAAGAATGATAT GGGAGGAT CT CAAAGAGT CCT GGAGAAACA 720 

Qy 816 GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 875 

II I M I I I I I I I I I I II I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 721 GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 780 

Qy 876 T TT CAACATT CT C CAGG CAGT TAC AGAT GT GAT T C GT AT CAAC GGGC GTGAT GT T GT C CT 935 

I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I 
Db 7 81 T TT CAACAT T CT C CAGG CAGT TAC AGAT GT GAT T C GT AT CAAC GGGC GTGAT GT T GT C CT 84 0 

Qy 936 GGCAACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACAT 995 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I 
Db 841 GGCAACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACAT 900 

Qy 996 GCT T GAC AT T GC C AGT GT TT T T ACT GGGAGAT T CAAGGAACAGAAGT CT C CT GAT T C CAC 1055 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GCT T GAC AT T GCCAGT GT T T T TACT GGGAGAT T CAAGGAACAGAAGT CT C CT GAT T C CAC 960 

Qy 1056 CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 1115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 961 CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 1020 

Qy 1116 AT C CT C C T T AGAAAGAT AT G CAAC CT C CAAT GAGTT C C CT GAT GAT AC CC T GAAC TT C AT 1175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 

Db 1021 AT C CT C CT T AGAAAGAT AT GCAAC CT C CAAT GAGT T C C CT GAT GAT AC CCT GAACTT CAT 108 0 

Qy 1176 CAAGAC G CAC C C GCT C AT GGAT GAGGCAGT GCC C T C C AT CT TCAAC AG GC CAT G GTT C CT 1235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 
Db 1081 CAAGAC GCAC C C G CT CAT GGAT GAGG CAGT GCC CT C CAT CT T CAAC AG GC CAT GGTT C CT 1140 

Qy 1236 GAGAACAATGGTCAGATACCGCCTTACCAAAATTGCAGTGGACACAGCTGCTGGGCCATA 1295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GAGAACAATGGTCAGATACCGCCTTACCAAAATTGCAGTGGACACAGCTGCTGGGCCATA 1200 

Qy 1296 T C AGAAT CAC ACT GTGGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CTT GAAGT T TTT G GC 1355 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1201 T CAGAAT CAC ACT GTGGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CT T GAAGT TTTT GGC 1260 

Qy 1356 CAGAAT AGGAAAT AGT GGT T T T CT AAAT GACAGC CTT T T C CT G GAGGAGAT GAGT GT T T A 1415 



12 61 C AGAAT AGGAAAT AGT GGTT T TCTAAAT GACAGC CTT TTC CT GGAGGAGAT GAGT GT T T A 132 0 

1416 CAACT CT G-AAAAAT GCAGCT AT GAT GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGC 1474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CAACT CT GAAAAAAT GCAGCT AT GAT GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGC 138 0 

1475 TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 1534 

I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1381 TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 1440 

1535 TTGGCCGGT GT GAAC GACAT GGGAAGT GT - AAAAAAAC CT GT AT T GC CTC CAGAGAC C CA 1593 

I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TTGGCCGGT GT GAAC GACAT GGGAAGT GTAAAAAAAAC CT GT AT T GC CTC CAGAGAC C CA 1500 

1594 TAT T GT GGAT GGATAAAGGAAGGT GGTGCCT GCAGCCATTTAT CACCCAACAGCAGACTG 1653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 TATT GT GGAT GGATAAAGGAAGGT GGT GCCT GCAGCCATTTAT CACCCAACAGCAGACTG 1560 

1654 ACT T TT GAGCAGGACAT AGAG CGT GGCAAT ACAGAT GGT CT GG GGGACT GT CACAAT T CC 1713 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ACTTTT GAGCAGGACAT AGAGCGTGGCAAT ACAGATGGTCT GGGGGACTGT CACAATT CC 1620 

1714 T T T GT GG CACT GAAT GGG C AT T C CAGT TCCCTCTTGCC CAGCACAAC CAC ATCAGATT CG 177 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 T T T GT GGCACT GAAT GGGCAT TCTAGT TCCCTCTTGCC CAGCACAAC C AC ATCAGAT T CG 168 0 

1774 AC GGCT CAAGAGG GGT AT GAGTCTAG GG GAG GAAT GCT GGACT G GAAG CAT CT GCTT GAC 1833 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 AC GGCT CAAGAGGGGTAT GAGT CTAGGGGAG GAAT GCT GGACT GGAAGCAT CT GCTT GAC 174 0 

1834 TCAC CT GACAGCACAG AC C CT TT GGGGGC AGT GT CT T C C C AT AAT CAC CAAGACAAGAAG 1893 

I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 T CAC CT GACAGCAC AGAC C CT TT GGGG GCAGT GT CTT CC CAT AAT CAC CAAGACAAGAAG 1800 

18 94 GGAGT GATT C GGGAAAGT T AC CT CAAAGGC CAC GAC CAGC T GGTT C C C GT CAC C CT CT TG 1953 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I II 
18 01 GGAGT GATT C GGGAAAGT T AC CT CAAAGGC CAC GAC CAGCT GGT T C C C GT CAC C CT CT T G 1860 

1954 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 2013 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
1861 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 192 0 

2014 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 2073- 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I 

1921 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 1980 

2074 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2133 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1981 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2040 

2134 ACT CAAT CC AAAGAC C CAAAGC C GGAG GC CAT C C T C ACGCCACT CAT GC ACAAC GG CAAG 2193 

MINIMI I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 ACT CAAT CC GAAGAC C CAAAGC C G GAG GC CAT C CT CACGC C ACT CAT GC ACAACGGCAAG 2100 

2194 CT C GC CACT C CC GGCAACAC GG C CAAGAT GCT C ATT AAAGCAGACC AGC AC CAC CT GGAC 2253 
I M I I I I I I I I I I I I I II I I I I I I I I II I I I I I II II I I II I I I I I I I I I I I I I I I I I I 



Db 2101 CT C GCCACT C CC GGCAACAC GG C C AAGAT GCT C ATT AAAGCAGACT AGCAC C AC CT G GAC 2160 

Qy 2254 CT GACG G C C CT C C C CAC CCCAGAGT CAAC C CCAAC GCTGCAGCAGAAGC GGAAG CC CAGC 2313 

I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
Db 2161 CT GAC GGCCCTCCC CAC C C CAGAGT CAAC C CCAAC GCT G CAGCAGAAGC GGAAGCC CAGC 2220 

Qy 2314 CGC GGCAGC C GC GAGT GGGAGAGGAAC CAGAAC CT CAT CAAT GC CT GCACAAAGGACAT G 2373 

I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 
Db 2221 C GC GGCAGC C GC GAGT G GGAGAGGAAC CAGAAC CT CAT CAAT GC CT GCACAAAGGACAT G 22 80 

Qy 2374 CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 2433 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 

Db 2281 CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 2340 

Qy 2434 AT CCCCAGC GTGGT GGT CCT GCC CAT CAC GCAGCAGGGCTACCAGCATGAGTACGT GGAC 24 93 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I M I I I I 

Db 2341 ATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGAC 2400 

Qy 2494 CAG CC CAAAATGAGC GAGGT GGC C C AGAT GGC GC T G GAGGAC C AGGC CGC CAC ACT GGAG 2553 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2401 CAG CC CAAAATGAGC GAGGT GGC C C AGAT GGC GCT GGAGGAC CAGGC CGC CAC ACT GGAG 24 60 

Qy 2554 TATAAGAC C ATC AAGGAAC AT CT C AGC AGCAAGAGT C CCAAC C AT GG GGT GAAC CT T GT G 2613 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2461 TATAAGAC CAT CAAGGAACAT CT CAG CAGCAAGAGT C CCAAC CATGGGGT GAAC CTT GT G 2520 

Qy 2614 GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 2673 

I I II I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 521 GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 258 0 

Qy 2 674 GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 2733 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2581 GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 264 0 

Qy 2734 T AC GGGGT T GACTAT AAGAG GAG CT AC C C CAC GAAC T CGCT CAC GAGAAGCCAC CAGGC C 2793 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2641 T AC GGGGT T GACTAT AAGAGGAGCT AC C C CAC GAACT C GCTCAC GAGAAGCCAC CAGGC C 2700 

Qy 2794 AC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT T C CT CT C AC CT CT C CAGAAAC CAG 2853 

I I I I I I I I I I I I M I I I I I I I II I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 2701 AC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT T C CT CT CAC CT CT C CAGAAAC CAG 2760 

Qy 2854 AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 2913 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 2820 

Qy 2914 CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 2973 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 2880 

Qy 2974 TACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCC 3033 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 TACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCC 2940 

Qy 3034 C C CAAAC CAT CCTTTGCTCCCCTTTC CAC AT C CAT GAAGCC CAAT GAT G C GT GTAC AT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 C C CAAAC CAT CCTTTGCTCCCCTTTC CAC AT C CAT GAAGC C CAAT GAT GC GT GTAC AT AA 3000 



RESULT 10 

AX099520 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



AX099520 3550 bp DNA linear PAT 02-APR-2001 

Sequence 160 from Patent WO0119988. 

AX099520 

AX09952 0. 1 GI: 13538594 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Jacobs, K., Mccoy,J.M., Lavallie , E . R. , Collins-Racie, L . A. , Evans, C, 
Merberg,D., Treacy,M., Bowman, M.R., Spaulding,V. and Agostino,M. J . 
Secreted proteins and polynucleotides encoding them 
Patent: WO 0119988-A 160 22-MAR-2001; 
Genetics Institute, Inc. (US) 

Location/ Qualifiers 

1. .3550 

/organism- n Homo sapiens" 
/mol type="unas signed DNA" 
/db ^ref="taxon:9606" 



ORIGIN 



Query Match 88.8%; 
Best Local Similarity 94.5%; 
Matches 2923; Conservative 



Score 2746.2; 
Pred. No. 0; 
1; Mismatches 



DB 6; Length 3550; 

4; Indels 165; Gaps 



l; 



Qy 



Db 



1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I M I I I I I I I I I 
12 6 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 185 



Qy 



Db 



61 C C AGAAGAT T CT GAG C CAAT CAGT AT T T C GCAT GGCAACT AT ACAAAAC AGT AT C C G GT G 12 0 

I I I I I I II I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
18 6 C C AGAAGAT T CT GAG C CAAT CAGT AT T T C GCAT GGCAACT AT ACAAAAC AGT AT C C G GT G 245 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 



121 TTT GT GGGCCACAAGCCAGGACGGAACAC CACACAGAGGCACAGGCT GGACAT CCAGAT G 18 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 6 TTT GT GGGCCACAAGCCAGGACGGAACAC CACACAGAGGCACAGGCT GGACAT CCAGAT G 305 

181 AT TAT GAT CAT GAAC GGAAC C CT CT AC AT T GCT GCTAGGGAC CAT AT TT AT ACT GT T GAT 24 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 

306 AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T GCT GCTAGGGAC CAT AT TT AT ACT GT T GAT 365 

241 AT AGACAC AT C ACACACGGAAGAAAT T TAT T GT AGCAAAAAACT GACAT G GAAAT CT AGA 30 0 

I I I I I I II I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

366 AT AGACAC AT C AC ACACS GAAGAAAT T T ATT GTAGCAAAAAACT GACAT G GAAAT CT AGA 425 

301 CAGGC CGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGT GCCACAACTTT 360 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

42 6 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGT GCCACAACTTT 4 8 5 

361 ATTAAAGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 42 0 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

48 6 ATTAAAGTT CTT CTAAAGAAAAACGATGAT GCATT GTTT GTCT GT GGAACTAAT GCCTT C 545 



Qy 421 AAC C CT T C CT GCAGAAACT AT AAGAT G GAT ACAT T G GAAC CAT T C GGG GAT GAAT T CAGC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 546 AAC C CT T C CT GCAGAAACT AT AAGAT GGAT ACAT T G GAAC CAT T C GGG GAT GAAT T CAGC 605 

Qy 4 81 GGAATGGCCAGATGCCCATAT GATGC CAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 54 0 

I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 606 GGAATGGCCAGATGCCCATAT GATGCCAAACATGCCAACGTTGCACTGTTTGCAGATGGA 665 

Qy 541 AAAC TAT ACT CAGC C ACAGT GAC T GACT T C CTT GC C AT T GAC GC AGT CAT T T AC C GGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 666 AAAC TAT ACT CAGC C ACAGT GAC T GACT T CCTT GCC AT T GACGC AGT CAT T T AC C GGAGT 725 

Qy 601 CTT GGAGAAAGCCCTACCCT GCGGACC GTCAAGCAC GATT CAAAAT GGTT GAAAGAACCA 660 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 726 CTT GGAGAAAGCCCT ACCCT GCGGACCGTCAAGCAC GATT CAAAAT GGTT GAAAGAACCA 785 

Qy 661 T ACT TT GT T CAAG C C GT GGAT TAC GGAGAT TAT AT CT ACT T CT T CT T CAG GGAAATAGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I 

Db 7 86 T ACT TT GT T CAAG C C GT GGAT TAC GGAGAT TAT AT CT ACT T CT T CT T CAGGGAAATAGCA 845 

Qy 721 GT G GAGT AT AACAC CAT GGGAAAGGT AGTT T TC C CAAGAGT GGCT C AGGT T T GTAAGAAT 780 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 846 GT G GAGT AT AACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT GGCT C AGGT TT GTAAGAAT 905 

Qy 7 81 GAT AT GGGAGGAT C T CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GT T C CT GAAG G CG C GC 840 

I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 906 GAT AT GGGAGGAT C T CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GT T C CT GAAGG C G C GC 965 

Qy 841 T T GAACT GCT CAGT T C CT GGAGACT CT CAT TTT T AT T T CAACAT T CT C CAGGC AGTT ACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I IE 

Db 966 T T GAACT GCT CAGT T C CT GGAGACT CT CATTTT TAT T T CAACAT T CT C CAGGCAGTT AC A 1025 

Qy 901 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1026 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 1085 

Qy 961 AG CAT C C CT GGGT C T G CAGT CT GT GC CT AT GACAT GCT T GACAT T GC CAGT GT T T TT ACT 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1086 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1145 

Qy 1021 GGGAGATTCAAGGAACAGAAGT CTCCT GATTCCACCT GGACACCAGTT CCT GAT GAACGA 108 0 

I I I I I I II I I I I I II I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1146 GGGAGATTCAAGGAACAGAAGT CTCCT GATTCCACCTGGACACCAGTT CCT GAT GAAC GA 1205 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1206 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 12 65 

Qy 1141 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC GC ACC C GCT CAT G GAT GAG 1200 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I 

Db 1266 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACTT C AT CAAGAC GC ACC C GCT CAT GGAT GAG 1325 

Qy 1201 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1326 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 1385 



Qy 1261 ACCAAAAT T GC AGT GGACACAG CT GCT GGGC C AT AT C AGAAT CACACT GTGGTTTTTCTG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 138 6 AC CAAAAT T GC AGT GGACACAG CT GCT GG GC C AT AT C AGAAT CACACT GTGGTTTTTCTG 14 45 

Qy 1321 G GAT C AGAGAAG G GAAT CAT C T T GAAGT TT T T GGC CAGAAT AGGAAAT AGT G GT T T T CT A 138 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 14 4 6 G GAT C AGAGAAG G GAAT CAT CT T GAAGTT T T T GGC CAGAAT AGGAAAT AGT G GT T TT CTA 15 05 

Qy 1381 AAT G AC AGC CTT T T C CT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GC AGCT AT GAT 1440 

I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 150 6 AATGAC AGC CTT T T C CT GGAGGAGAT GAGT GT TT ACAACT CT GAAAAAT GC AGCT AT GAT 15 65 

Qy 1441 GGAGT C GAAGACAAAAGGAT CATGGGC AT GCAGCT GGACAGAGCAAGCAGCT CT CT GTAT 1500 

I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1566 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GTAT 1625 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 15 60 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 

Db 162 6 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1685 

Qy 1561 T GT AAAAAAAC CT GTAT T GC CT C C AGAGAC C CAT AT T GT GGAT G GAT AAAGGAAGGT G GT 1620 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 168 6 T GT AAAAAAAC CT GTAT T GC CT C C AGAGAC C CAT AT T GT GGAT G GAT AAAGGAAGGT G GT 1745 

Qy 1621 GCCT G CAGCCAT T TAT CAC C CAACAGC AGACT GACT TT T GAG CAGGAC AT AGAGC GT GGC 1680 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 174 6 GCCT GCAGCCATTTATCACCCAACAGCAGACTGACTTTT GAGCAGGACAT AGAGC GTGGC 18 05 

Qy 1681 AAT AC AGAT GGT CT GG GGGACT GT CACAAT T C CTT T GT GGCACT GAAT GGG C AT T C CAGT 17 40 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 06 AATACAGATGGT CT GGGGGACT GT CACAAT T C CTT T GT GGCACT GAAT 1853 

Qy 1741 TCCCTCTT GCC C AGCACAAC C ACAT C AGAT T C GAC GGCT CAAGAGGGGT AT GAGT CTAGG 18 00 

Db 1854 1853 

Qy 1801 GGAG GAAT GCT GGACT GGAAGC AT CT G CT T GACT C AC CT GACAGC AC AGAC CCTTTGGGG 1860 

Db 1854 1853 

Qy 18 61 GCAGT GT CTT C C CAT AAT CAC CAAGACAAGAAGGGAGT GATT C GGGAAAGT T AC CT C AAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1854 ■ GGAGT GATT C G GGAAAGT T AC C T C AAA 18 80 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I 

Db 18 81 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1940 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2 04 0 

I II I M I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1941 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2000 

Qy 2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2001 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2 060 



Qy 



2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 



I I I I I I I I I I I I I M I II I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2061 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2120 

Qy 2161 GC CAT C CT C AC GC C ACT CAT GCACAAC GGCAAGC T C GC C ACT C C CGGC AAC AC G G C CAAG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 
Db 2121 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 218 0 

Qy 2221 AT GCT CATT AAAGC AGAC CAGC ACCAC CT GGAC CT GAC GG CC CT CC C CAC C CCAGAGT C A 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2181 AT GCT CATTAAAGC AGAC CAG C ACCAC CT GGAC CT GAC GGCC CT CC C CAC C C CAGAGT C A 22 4 0 

Qy 22 81 AC C C CAAC GCT GCAGCAGAAGC GGAAGC C CAGC C G C GG CAGC C G C GAGTGGGAGAG GAAC 234 0 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2241 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 2300 

Qy 2341 C AGAAC CT CAT CAAT G C CT GC ACAAAGGACAT GC C C C C C AT GG GCT C C CCT GT GAT T C C C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2301 C AGAAC CT CAT CAAT GC CT GC ACAAAGGACAT GC C C C C C AT GGGCT C C CCT GT GAT T C C C 2360 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2361 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2420 

Qy 24 61 AC GCAG CAGG GCT AC C AGCAT GAGT AC GT GGAC CAGC C CAAAAT GAGC GAG GT GGC CC AG 252 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I 

Db 2 421 AC GC AGCAGGGCT AC CAGCAT GAGT AC GT GGAC CAGC C CAAAAT GAGC GAGGT GG C CC AG 24 8 0 

Qy 2521 AT GGC GCT GGAGGAC CAGGCC G C CACACT GGAGT AT AAGAC CAT CAAGGAACAT CT CAGC 2580 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 81 AT GGC GCT GGAGGAC C AG GCC G C CAC ACT GGAGT AT AAGAC CAT CAAG GAAC AT T T CAGC 254 0 

Qy 2581 AGCAAGAGT C CCAACC AT GGGGT GAAC CT T GTGGAGAAC CT G GAC AGC CTGCCCCC CAAA 264 0 

I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2541 AGCAAGAGT C C CAAC CAT GGG GT GAAC CT T GT GGAGAAC CT GGAC AGC CT GC CC C C CAAA 2600 

Qy 2 641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

I I I M I I I I I II I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I Mllllllll.il 
Db 2 601 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTTTCAGACCGGTTTA 2660 

Qy 27 01 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2661 AGCAAGCGGCTGGAAATGCACCACTCCTTTTCCTACGGGGTTGACTATAAGAGGAGCTAC 272 0 

Qy 27 61 CCCACGAACT CGCT CACGAGAAGCCACCAGGCCACCACT CT CAAAAGAAACAACACTAAC 2820 

I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2721 CCCACGAACTCGCT CACGAGAAGCCACCAGGCCACCACT CTCAAAAGAAACAACACTAAC 2780 

Qy 2 821 T CCT C CAAT T CCT CT CAC CT CT CCAGAAACCAGAGCT T T GGC AGG GGAGACAAC C C G C C G 28 8 0 

I I I I I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I M I I I I I I I I I 

Db 2781 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 2840 

Qy 2 881 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2 940 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 2841 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2900 

Qy 2941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

I I I || I I I I I I I I I I I I I I I I I I I I I I II I I M II I I I I I I I I I I II I I I I I I I I I I I II 



Db 



2 901 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 2960 



Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2961 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3020 

Qy 3061 ACAT C CAT GAAGC C CAAT GAT GC GT GT ACATAA 3093 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3021 ACAT C CAT GAAGC C CAAT GAT G C GT GT ACATAA 3053 
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Query Match 88.8%; Score 2746.2; 

Best Local Similarity 94.5%; Pred. No. 0; 
Matches 2923; Conservative 1; Mismatches 



DB 6; Length 3550; 

4; Indels 165; Gaps 



1; 



Qy 



Db 



1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

12 6 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 185 



Qy 



Db 



61 C C AGAAGAT T C T GAGC CAAT CAGT AT TT C G CAT GGCAACT ATACAAAAC AGT AT C C GGT G 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
18 6 C C AGAAGAT T CT GAG C CAAT CAGT AT TT C G CAT GG CAACT AT ACAAAAC AGT AT C C G GT G 245 



Qy 121 T T T GT GG GC CACAAGC CAGGAC GGAACAC CACACAGAG G CAC AGG CT GGACAT C CAGAT G 18 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 6 T T T GT GG GC CACAAGC CAGGAC GGAACAC CACACAGAG G CAC AGGCT GGACAT C CAGAT G 305 

Qy 181 AT TAT GAT CAT GAAC GGAAC CCT CT AC AT T GCT G CT AGGGAC CAT AT TT AT ACT GT T GAT 24 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 306 AT TAT GAT CAT GAAC GGAAC CCT C T AC AT T GCT GCT AG GGAC CAT AT TT AT ACT GT T GAT 365 

Qy 241 AT AGAC AC AT CAC AC AC G GAAGAAAT T TAT T GT AG C AAAAAACT GAC AT G G AAAT C T AGA 300 

I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 366 AT AGAC AC AT CAC ACAC S GAAGAAAT T TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 425 

Qy 301 CAGGC C GAT GT AGACACAT GCAGAAT GAAG GGAAAACAT AAGGAT G AGT G C C ACAAC T T T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 426 CAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC C ACAACT T T 485 

Qy 361 AT T AAAGT T CTT CT AAAGAAAAAC GAT GAT GC AT T GT T T GT CT GT GGAAC TAAT GC CT T C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 486 AT T AAAGT T CTT CT AAAGAAAAAC GAT GAT GC AT T GT TT GT CT GT GGAAC TAAT GC CT T C 545 

Qy 421 AACCCTT CCT GCAGAAACTATAAGAT GGATACATT GGAAC CATTCGGGGAT GAATTCAGC 48 0 

I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I II I I II I I 
Db 546 AACCCTT CCT GCAGAAACTATAAGAT GGATACATT GGAAC CATTCGGGGAT GAATT CAGC 605 

Qy 481 GGAATGGCCAGAT GCC CAT ATGATGCCAAACAT GCCAACGTT GCACT GTTT GCAGAT GGA 54 0 

I I I I I I I I I II M I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 606 GGAAT GGCCAGAT GCCCAT ATGATGCCAAACAT GCCAACGTT GCACT GTTT GCAGAT GGA 665 

Qy 541 AAACTATACT CAGCCACAGT GACTGACTT C CTT GCC ATT GACGCAGT CATTT ACCGGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I 
Db 666 AAACTATACT CAGCCACAGT GACTGACTT CCT T GCC ATT GACGCAGT CATTT ACCGGAGT 725 

Qy 601 CTT GGAGAAAGC C CT AC C CT GC GGAC C GT CAAGCAC GATT CAAAAT GGT T GAAAGAACC A 660 

I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 72 6 CTT GGAGAAAGC C CT ACC CT GC GGAC C GT CAAGCAC GATT CAAAAT GGT T GAAAGAACCA 785 

Qy 661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 72 0 

I I I I I I II I I II II I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 78 6 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 845 

Qy 721 GT GGAGT ATAACACCATGGGAAAGGTAGTTTT CCCAAGAGTGGCT CAGGTTT GTAAGAAT 78 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 84 6 GT GGAGTAT AACACCATGG GAAAGGT AGT T TT C CCAAGAGT GGCT C AGGT T T GTAAGAAT 905 

Qy 781 GAT AT GGGAGGAT CT C AAAGAGT CCT GGAGAAAC AGT G GAC GT CGT T C CT GAAGGC GCGC 84 0 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 
Db 906 GAT AT GGGAGGAT CTCAAAGAGTCCT GGAGAAACAGTGGACGT CGTT CCT GAAGGC GCGC 965 

Qy 841 T T GAACT GCT C AGTT C CT GGAGACT CT C AT TT T TAT TT GAAC ATT CT C C AGGCAGT T ACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 966 T T GAACT GCT C AGTT C CT G GAGACT CT C AT TT T T AT TT CAAC ATT CT C CAGGC AGT T AC A 1025 

Qy 901 GAT GT GAT T CGT AT CAAC GG GC GT GAT GT T GT C CT G GCAAC GT TTT CT ACAC CT TAT AAC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1026 GAT GT GAT T CGT AT CAAC GGG C GT GAT GT T GT C CT GGC AAC GT T T T CT ACAC CT TAT AAC 1085 



Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 108 6 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1145 

Qy 1021 GG GAGAT T CAAG GAAC AGAAGT C T C CT GATT C CAC CT G GACAC CAGT T C CT GAT GAACGA 1080 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I 
Db 114 6 GGGAGAT T CAAGGAAC AGAAGT CT C CT GAT T C CAC CT G GACAC CAGT T C CTGAT GAACGA 12 05 

Qy 1081 GTTCCT7\AGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I M I M I I I I I II I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II 
Db 1206 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 12 65 

Qy 1141 T CCAAT GAGTT C CCT GAT GATACCCT GAACTT CAT CAAGACGCAC CCGCT CAT GGAT GAG 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II II I I I I I I I I I I I I 
Db 1266 T CCAAT GAGTT CCCT GAT GATACCCT GAACTT CAT CAAGACGCACCCGCT CAT GGAT GAG 1325 

Qy 1201 G CAGT GCC C T C CAT CT T CAAC AGG C CAT G GTT C CT GAGAACAAT GGT CAGAT ACC GC CT T 1260 

I I I I I II I I I I I I I M I I I I II I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I 
Db 1326 G CAGT GC C CT C CAT CT T CAAC AG G C CAT G GT T C CT GAGAACAAT GGTCAGAT ACC G C CT T 1385 

Qy 1261 AC CAAAAT T GC AGT GGAC ACAGCT GC T G GGC C ATAT CAGAAT CACACT GT GGT T TT T CT G 1320 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I 

Db 1386 ACCA7\AATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1445 

Qy 1321 GGAT C AGAGAAGGGAAT C AT CT T GAAGT T T T T GGC CAGAAT AGGAAAT AGT GGTT TT CT A 1380 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II 
Db 144 6 GGAT C AGAGAAG GGAAT C ATCT T GAAGTT TT T GGC CAGAAT AGGAAAT AGT GGTTT T CT A 1505 

Qy 1381 AAT GACAG C CT T T T C CTGGAGGAGAT GAGT GT T TACAACT CT GAAAAAT GCAGCT AT GAT 14 4 0 

I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 
Db 1506 AAT GACAGC CT T T T C CT G GAGG AG AT GAGT GT T TACAACT CT GAAAAAT GCAGCT AT GAT 1565 

Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GT AT 1500 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1566 GGAGT CGAAGACAAAAGGAT CAT G GGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GTAT 1625 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 162 6 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1685 

Qy 1561 T GT AAAAAAAC CT GT AT T GC CT C CAGAGACCCAT AT T GT GGAT G GATAAAGGAAGGT G GT 1620 

I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I i I 

Db 168 6 T GT AAAAAAAC CT GTAT T GC CT CC AGAGACC CAT AT T GT GGAT GGAT AAAG GAAGGT GGT 1745 

Qy 1621 GC CT GCAG C CAT T TAT CAC C CAACAGC AGACT GACT TT T GAGCAGGACAT AGAG C GT GGC 1680 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I M 
Db 174 6 GC C T GCAGC C AT TT AT CAC C CAAC AGC AGACT GACT T T T GAGCAG GACAT AGAGC GTGGC 1805 

Qy 1681 AAT ACAGAT G GT CT G GGGGACT GT CACAATT C CT T T GT GGC ACT GAAT G GGCAT T C CAGT 1740 

I I I II I I I I I I I I II I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I 

Db 1806 AAT ACAGAT G GT CT GGGGGACT GT CACAATT C CT T TGT GGC ACT GAAT 1853 

Qy 1741 TCCCTCTT GC C CAGC ACAAC CAC AT CAGAT T C GAC GGCT CAAGAGGG GTAT GAGT CT AGG 1800 
Db 1854 1853 



Qy 



1801 GGAGGAAT GCT GGACT GGAAGC AT CT G CTT GAC T CAC CT GACAGCACAGAC CCTTTGGGG 1860 



Db 1854 1853 

Qy 1861 GCAGT GT CT T CC C ATAAT CACCAAGACAAGAAGGGAGT GAT T C GG GAAAGT T AC CT CAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1854 GGAGT GAT T C GG GAAAGT T AC CT CAAA 1880 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

M I I! I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1881 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1940 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1941 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2000 

Qy 2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I | I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2001 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2060 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M 

Db 2061 AG C GT CAC CAAGCT C AGC GGCCT CT T T G G GGAC ACT CAAT CC AAAGAC C CAAAGC C GGAG 2120 

Qy 2161 GC CAT C CT CAC G C CACT CAT GC ACAAC GGCAAGCT C G C C ACT C CC G G CAACAC GG C CAAG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2121 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2180 

Qy 2221 AT GCT CAT T AAAG CAGAC CAGC ACCAC CT GGAC CT GAC GG C C CT C C C C AC CC CAGAGT CA 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2181 AT GCT CAT TAAAGCAGAC C AG CAC CAC CT GGACCT GAC GGCCCTCCC CAC CC CAGAGT C A 22 40 

Qy 2281 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2241 AC CC CAAC G CT GCAGCAGAAGC GGAAGC C CAGC CGC GGC AGC C G C GAGT GGGAGAGGAAC 2300 

Qy 2341 CAGAAC CT CAT CAAT GCCT GC AC AAAGGACAT GCC C CC CAT GGGCTCCCCTGT GAT T C C C 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2301 CAGAAC CT CAT CAAT GC CT GC AC AAAGGACAT GC C C C C CAT GGGCTCCCCT GT GAT T C C C 2360 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 2361 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2420 

Qy 24 61 AC GCAGC AGGGCT AC CAGCAT GAGT ACGT GGAC C AG CC CAAAAT GAGC GAGGT GG C CC AG 2520 

I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I II I I I I I I I II M I I I I I I I I I I II I I I 
Db 2421 AC GCAGC AG GG CT AC CAGCAT GAGTACGT GGAC C AGC CCAAAAT GAGC GAGGT GGC C C AG 24 80 

Qy 2521 AT GGCGCT GGAGGACCAGGCCGCCACACT GGAGT AT AAGAC CAT CAAGGAACATCT CAGC 2580 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 
Db 24 81 AT GGCGCT GGAGGAC CAGGCC GCCACACT GGAGT AT AAGAC CAT CAAGGAACAT T T CAGC 2540 

Qy 2581 AGCAAGAGT C C CAAC CAT GG GGT GAAC CT T GT GGAGAAC CT GGACAG CCTGCCCCC CAAA 2640 

I | I | II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 2541 AGCAAGAGT C C CAAC CAT GGG GT GAAC CT T GT GGAGAAC CT GGACAGC C T GC CC C CCAAA 2600 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

I I I I I I I I I I I II I I I I I I I I I I I I M I II I I I I I I I I I I I I I II I I I I I I I I I II II 



Db 



2601 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTTTCAGACCGGTTTA 2 660 



Qy 


2701 


Db 


O C C 1 


Qy 


2761 


Db 


2721 


Qy 


2821 


Db 


27 81 


Qy 


2881 


Db 


2841 


Qy 


2941 


Db 


2901 


Qy 


3001 


Db 


2961 


Qy 


3061 


Db 


3021 



AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I M I I I I I I M 

AGCAAGCGGCTGGAAATGCACCACTCCTTTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2720 

CCCACGAACTCGCTCACGAGAAGCCACCAGGCCACCACTCTCA7WVG7U^CAACACTAAC 2 820 

I I I II I I II I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I 

CCCACGAACTCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTT^lC 2780 

TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 2880 

I | | | I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 2840 

CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2 940 

I I I I I I I M I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2900 

GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 2960 

AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I | M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3020 

ACAT CCAT GAAGCCCAAT GAT GC GT GTACATAA 3093 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

ACAT C CAT GAAG C C C AAT GAT GC G T GTACATAA 3053 
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FT CDS 

FT misc feature 



60/123667 PI 



Location/Qualifiers 
(214) . . (2865) 
(2882) 



FT /note= ! an n may be any one of a or t or g or 

FT c' . 

FEATURES Location/Qualifiers 
source 1. .3333 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 87.2%; Score 2698; DB 6; Length 3333; 

Best Local Similarity 93.9%; Preci. No. 0; 

Matches 2907; Conservative 0; Mismatches 21; Indels 167; Gaps 3; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I II I M I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I II I I I I 

Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

Qy 61 C CAGAAGAT T CT GAG CCAAT C AGT AT TT C GCAT GG CAACT AT ACAAAACAGT AT CC GGT G 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 274 CCAGAAGATT CT GAGCCAAT CAGTATTT C GCAT GGCAAC TAT ACAAAACAGT AT CC GGT G 333 

Qy 121 TTTGT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACATCCAGAT G 18 0 

I | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 T T T GT GG GCC ACAAGCCAGGAC GGAAC AC C ACAC AGAGGC ACAGGCT G GACATCCAGAT G 393 

Qy 181 ATT AT GAT CAT GAAC GGAAC C CT CT AC AT T G CT G CT AGGGAC CAT AT T TAT ACT GT T GAT 240 

I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I 
Db 394 ATT AT GAT CAT GAAC GGAAC C CT CTACAT T GCT G CTAGGGAC CAT AT T TAT ACT GT T GAT 453 

Qy 241 AT AGACACAT CAC ACAC GGAAGAAAT T TAT T GTAGCAAAAAACT GAC AT G GAAAT CT AGA 300 

M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I 
Db 454 AT AGACACAT CAC ACAC GGAAGAAATT TAT T GT AG CAAAAAACT GAC AT GGAAAT CT AGA 513 

Qy 301 CAGGCC GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGTGC CACAACT T T 360 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 514 CAGGCC GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACT T T 57 3 

Qy 361 ATTAAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAAC T AAT GCCT T C 420 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 574 ATTAAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGAAC TAAT G CCT T C 633 

Qy 421 AAC C CT T CCT GC AGAAAC TAT AAGAT G GAT ACAT T GGAAC CATT C GGG GAT GAAT T C AGC 480 

I M I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db . 634 AAC C CTT C CT GCAGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T C GGGGAT GAAT T C AGC 693 

Qy 481 GGAATGGCCAGAT GCCCATAT GATGCCAAACATGCCAACGTTGCACT GTTTGCAGATGGA 540 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GGAAT GG C CAGAT GCC CAT AT GAT GC CAAACAT G CCAAC GT T GCACT GTT T GC AGAT GGA 753 

Qy 541 AAACT AT ACT CAGC CACAGT GACT GACT T C CTT GCCATT GAC G CAGT CAT T T AC C GGAGT 600 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 
Db 754 AAACT AT ACT C AG C CACAGT GAC T GACT T C CTT G CCAT T GAC GCAGT CAT T TAC C G GAGT 813 

Qy 601 CTT GGAGAAAGC C CT AC CCT GC GGAC C GT CAAG CAC GAT T CAAAAT GGTT GAAAGAAC C A 660 

I | || | I I I I I I I I I I I I I II I I I I I II I I I I I I M I I I I I I I I M I I I I I I I I I II I I I I 
Db 814 CT T GGAGAAAGC C CT AC C CT GC G GAC C GT CAAGCAC GAT T CAAAAT GGT T GAAAGAAC CA 87 3 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGA7\ATAGCA 720 

I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I > I I I I I I I I I I I I I I I I I I I I I 
874 TACT T T GT T CAAGC C GT G GAT T AC G GAGATT AT AT CT ACTT CT T CTT C AGG GAAAT AGCA 933 

721 GT GGAGT AT AACAC CAT G G GAAAGGT AGT TT T CC CAAGAGT GGCT CAGGTT T GTAAGAAT 780 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
934 GT GGAGT AT AACAC CAT GG GAAAGGT AGT TT T CC CAAGAGT GGCT CAG GTT T GTAAGAAT 993 

7 81 GAT AT GG GAG GAT CT C AAAGAGT C CT GGAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GC 84 0 

I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
994 GAT AT GG GAGGAT CT CAAAGAGT C C T G GAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GC 1053 

841 T T GAACT G CT C AGT T CCT G GAGACT CT C ATT T TT AT T T C AACAT T CT C CAG GCAGTTAC A 900 
I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I ! I I I I I I I i I I I I I I I II I I I I I I I I I I 
1054 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 1113 

901 GAT GT GAT T C GTAT CAAC GG GC GT GAT GT T GT CCT GG CAAC GTT T T CT ACAC CT T AT AAC 960 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1114 GAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT CCT GGCAAC GTT T TCT AC AC CT TAT AAC 1173 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 
I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1174 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1233 

1021 GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTTCCT GAT GAACGA 1080 

I | I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1234 GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT CCT GAT GAACGA 1293 

1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I ! I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
1294 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1353 

1141 T CCAAT GAGT T C C CT GAT GAT AC C CTGAACT T CAT CAAGAC GC AC CC G CT C AT GGAT GAG 1200 

I I I I I I I II I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1354 T C CAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC CC GCT CAT GGAT GAG 1413 

12 01 GCAGT GC C CT C CAT CT T CAACAGGC C AT GGT TC CT GAGAACAAT GGT CAGAT AC C GC CT T 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1414 GCAGT GC C CT C CAT CTT CAACAG GC CAT GGT T C C T GAGAACAAT GGT CAGAT AC C GC CT T 147 3 

12 61 AC CAAAATT GCAGT GGACACAGCTGCT GGGCCAT AT CAGAATCACACT GT GGTTTTT CT G 132 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I 
14 74 AC CAAAAT T GCAGT GGACAC AGCT GCT GGG C CAT AT C AGAAT C AC ACT GTGGTTTTTCTG 1533 

1321 GGAT C AGAGAAGG GAAT CAT CTT GAAGT TT T T GGC C AGAAT AG GAAAT AGT GGT T TT CT A 1380 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I II I I I I I II I I 
1534 GGAT CAGAGAAGGGAAT CAT CTTGAAGTTTTTGGCCAGAATAGGAAATAGT GGTTTT CTA 1593 

1381 AAT GACAGC CTTTT CCT GGAGGAGAT GAGT GTTTACAACT CTGAAAAATGCAGCTAT GAT 1440 

I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I I M II I II I I I I I I I I I I M I 

1594 AAT GACAGCCTTTT CCT GGAGGAGAT GAGT GTTTACAACT CTGAAAAATGCAGCTAT GAT 1653 

1441 GGAGTCGAAGACAAAAGGATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTAT 1500 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1654 GGAGT C GAAGACAAAAGGAT CAT GGGCAT GCAGC T GGACAGAGCAAGCAGCT CT C T GTAT 1713 

1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 



Db 



1714 



1773 



Qy 1561 TGTAAAAAAACCTGTATTGCCTCCAGAGACCCATATTGTGGATGGATAAAGGAAGGTGGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1774 T GT AAAAAAAC CT GT ATT GC CT C CAGAGACC CAT AT T GT GGAT GGATAAAGGAAGGT G GT 18 33 

Qy 1621 G C CT GCAGC CATT T AT CAC CCAACAGCAGACT GACTTT T GAGCAGGAC AT AGAGC GT G GC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1834 GC CT GC AG C CAT T TAT CAC CCAACAGCAGACT GAC T TT T GAG CAGGAC AT AGAGC GT GGC 18 93 

Qy 1681 AATACAGAT GGT CT GGGGGACT GT CACAATTCCTTT GT GGCACTGAAT GGGCATTCCAGT 1740 

I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1894 AATACAGAT GGT CT G GG GGACT GT CACAATT C CTT T GT G GC ACT GAAT 1941 

Qy 1741 TCCCTCTT GCC C AGC ACAAC C ACAT CAGATT C GAC GGCT CAAGAGGGGT AT GAGT CTAGG 18 00 

Db 1942 1941 

Qy 18 01 GGAGGAAT G CT G GACT GGAAGCAT CT GCT T GACT C ACCT GAC AGCAC AGAC CCTTTGGGG 18 60 

Db 1942 1941 

Qy 18 61 G CAGT GT CT T C C CAT AAT CAC CAAGACAAGAAG G GAGT GAT T C GG GAAAGT T ACCT CAAA 1920 

I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1942 GGAGT GAT T C GGGAAAGT T AC CT CAAA 1968 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1969 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2028 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 
Db 2029 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2 088 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 208 9 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2148 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2149 AGC GT CAC CAAGCT CAG C GG C CT CTTT GGGGACACT CAAT C CAAAGAC C CAAAGCC GGAG 2208 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 22 09 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2268 

Qy 2221 AT GCT CAT T AAAGC AG AC C AGCAC CAC CT GGACCT GAC GG C C CT C CC CAC C CCAGAGT CA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I M 
Db 22 69 AT GCT CAT T AAAGC AGAC CAGCAC CAC CT GGACCT GAC GGC C CT C CC C AC CC CAGAGT CA 2328 

Qy 22 81 ACC C CAAC GCT GCAGC AGAAGCG GAAGC CCAGCC G CGGCAG C C GC GAGT GGGAGAGGAAC 234 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2329 ACCCCAACGCTGCAGCAGAAGCGGGAACCCAGCCGCGGCACCCGCGAGTGGGAGAGGAAC 2388 

Qy 2341 CAGAAC CT CAT CAAT GC CTGC ACAAAGGAC AT GC C CC C CAT GG GCT CC CCT GT GATT C C C 2400 

I || I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I 



Db 



2389 CAGAACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 2448 



Qy 24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2449 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2508 

Qy 2461 AC GC AGCAG GGCT AC CAGCAT GAGT ACGT GGAC CAG C C CAAAAT GAGC GAG GT GG C C CAG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 250 9 AC GC AGCAG GGCT AC CAGCAT GAGT ACGT GGAC CAG C C CAAAAT GAGC GAGGT GGC C CAG 2568 

Qy 2521 AT GGCGCT GGAGGACCAGGCCGCCACACT GGAGTATAAGACCATCAAGGAACATCT CAGC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2569 AT GGC GCT GGAG GAC CAG GCC GC C ACACT GGAGTAT AAG ACC AT CAAGGAAC AT CT CAGC 2 628 

Qy .2581 AGCAAGAGT CC CAAC CAT GGGGT GAACCT T GT GGAGAAC CT GGACAGC CTGCCCCC CAAA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 262 9 AG CAAGAGT CC CAAC CAT GGGGT GAACCT T GT GGAGAAC CT GGAC AGC CT GC C CC C CAAA 2 688 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2689 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2748 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 274 9 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 28 08 

Qy 2761 C C CAC GAACTC GCT CACGAGAAGC C ACCAGG C C AC C - ACT CT CAAAAGAAACAACACT AA 2819 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2809 C C CAC GAACT C GCT CAC GAGAAGC C ACCT GAC CAC CT ACTCT CAT CAGAAGCAAC ACT AA 2868 

Qy 2820 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 2 87 8 

III I I I I I I III II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 28 69 C C CC GACAATT CAN C T CT GACT T CAAAGGGAC CAGAGCT TT GG C AG GGGAGACAACCCGC 2928 

Qy 2 87 9 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2 938 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2929 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2988 

Qy 2939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2 998 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 298 9 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3048 

Qy 2999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 

Db 304 9 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3108 

Qy 3059 C CAC AT C CAT GAAG C C C AAT GAT G C GT GT AC AT AA 30 93 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 3109 C CAC AT C CAT GAAG C C C AAT GAT G C GT GT AC AT AA 3143 



RESULT 13 
BC059238 

LOCUS BC059238 4702 bp mRNA linear ROD 20-OCT-2003 

DEFINITION Mus musculus sema domain, transmembrane domain (TM) , and 

cytoplasmic domain, (semaphorin) 6A, mRNA (cDNA clone MGC: 66957 

IMAGE: 6417475) , complete cds . 
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FEATURES 



Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 125 Row: o Column: 20 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 9055333. 
Location/Qualifiers 



source 1. -4702 

/organism="Mus mus cuius" 
/mol_t ype= "mRNA" 
/strain="C57BL/6" 
/db_xref="taxon: 10090" 
/clone="MGC: 66957 IMAGE: 6417475" 

/tissue_type-"Brain, enriched mouse brain 12.5dpc" 
/clone JULb="NIH_BMAP_FI0" 
/lab_host="DH10B" 
/note="Vector: pYX-ASC" 
gene 1. .4702 

/ gene= " S ema6a " 

/note=" synonyms : Via, sema, Sema6A-l, A730020P05Rik" 
/db_xref-"Locus ID: 20358" 
/db_xref ="MGI : 1203727 " 
CDS 632. .3727 

/codon_start=l 
/product="Sema6a protein" 
/protein_id="AAH59238 . 1" 
/db_xref="GI: 37748387" 
/db_xref="LocusID: 20358" 

/translation="MRPAALLLCLTLLHCAGAGFPEDSEPISISHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNRTLYVAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDTLFVCGTNAFNPSCRNYRVDTLETFGDEFS 
GMARCPYDAKHANIALFADGKLYSATVTDFLAIDAVIYRSLGDSPTLRTVKHDSKWLK 
EPYFVQAVDYGDYIYFFFREIAVEYNTMGKWFPRVAQVCKNDMGGSQRVLEKQWTSF 
LKARLNCSVPGDSHFYFNI LQAVTDVI RINGRDWLATFSTP YNS I PGSAVCAYDMLD 
IANVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLEKYATSNEFPDDTLNFI 
KTHPLMDEAVPSIINRPWFLRTMVRYRLTKIAVDNAAGPYQNHTWFLGSEKGIILKF 
LARIGSSGFLNGSLFLEEMNVYNPEKCSYDGVEDKRIMGMQLDRASGSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWVRESGSCAHLSPLSRLTFEQDIERGNTDGLG 
DCHNSFVALNGHASSLYPSTTTSDSAS RDGYESRGGMLDWNDLLEAPGSTDPLGAVSS 
HNHQDKKGVIRESYLKSNDQLVPVTLLAIAVILAFVMGAVFSGIIVYCVCDHRRKDVA 
WQRKEKELTHSRRGSMSSVTKLSGLFGDTQSKDPKPEAILTPLMHNGKLATPSNTAK 
MLIKADQHHLDLTALPTPESTPTLQQKRKPNRGSREWERNQNIINACTKDMPPMGSPV 
IPTDLPLRASPSHIPSVWLPITQQGYQHEYVDQPKMSEWAQMALEDQAATLEYKTI 
KEHLSSKSPNHGVNLVENLDSLPPKVPQREASLGPPGTSLSQTGLSKRLEMQHSSSYG 
LEYKRSYPTNSLTRSHQTTTLKRNNTNSSNSSHLSRNQSFGRGDNPPPAPQRVDSIQV 
HSSQPSGQAVTVSRQPSLNAYNSLTRSGLKRTPSLKPDVPPKPSFAPLSTSMKPNDAC 

misc_feature 797, .2062 

/note^"Sema; Region: semaphorin domain" 

/db_xref="CDD: smart00630" 
misc_feature 2171. .2272 

/note="PSI; Region: domain found in Plexins, Semaphorins 

and Integrins" 

/db_xref="CDD:smart00423" 

ORIGIN 



Query Match 83.5%; Score 2584; DB 10; Length 4702; 

Best Local Similarity 89.9%; Pred. No. 0; 

Matches 2783; Conservative 0; Mismatches 310; Indels 3; Gaps 1; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

Ml II III I I II I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 632 ATGCGGCCAGCAGCCTTACTGCTGTGTCTCACACTGCTACACTGCGCTGGGGCTGGTTTC 691 



Qy 61 C C AGAAGATT C T GAG C CAAT CAGT AT T T C GCAT GGCAACT AT ACAAAACAGT AT C C GGT G 120 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I > I I I I I I I I I I > I I M I I I 
Db 692 C C AGAAGAT T C C GAGC CAAT CAGT AT TT C GCAT G G CAACT AT ACAAAACAGT AT C C GGT G 751 

Qy 121 TTTGT GGGCCACAAGCCAGGAC GGAACACCACACAGAGGCACAGGCT GGACATCCAGATG 180 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 752 T T T GT G G GC C ACAAGC C AG GAC G GAACACC AC GCAGAGGC AC AG GCT GGAC AT CCAGAT G 811 

Qy 181 AT TAT GAT CAT GAAC GGAAC CCT CT AC ATT G CT GCT AG GGAC CAT AT T TAT ACT GT T GAT 240 

II I I I I I II I I I I I I.I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 812 ATCAT GATCAT GAACAGAACCCT CTACGTTGCT GCT CGAGACCATATTTATACTGTT GAT 871 

Qy 241 ATAGACACAT CACACACGGAAGAAATTTATT GTAGCAAAAAACT GACATGGAAAT CTAGA 300 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 872 ATAGACACAT CCCACACAGAAGAAATTTACTGTAGCAAAAAACTGACAT GGAAAT CTAGA 931 

Qy 301 C AGGC C GAT GTAGACACAT GC AGAAT GAAGG GAAAACAT AAGGAT GAGT GC C ACAACTT T 360 

I I I I I II I I I I I I I I I I I I I I II I I I I II I II I II I I I I I I I I II I I I I I I II 
Db 932 CAGGCT GAC GTAGACACAT GC AG GAT GAAGGGGAAACATAAGGATGAATGT CACAACTT C 991 

Qy 361 AT T AAAGTT CT T CT AAAGAAAAACGAT GAT GCAT T GT T T GTCT GT G GAACT AAT GC CTT C 420 

I M I II M I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 992 AT T AAAGTT C T T CT CAAGAAGAAT GAT GAT AC GCT GTT T GT CT GT GGAAC CAAT GC CTT C 1051 

Qy 421 AACC CT T CCT GCAGAAACTATAAGAT G GAT ACAT T G GAAC CAT T CGG GGAT GAAT T CAGC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I II I I I I I I I III 
Db 1052 AACCCTTCCTGCAGAAACTACAGGGTCGATACCTTGGAAACTTTTGGGGATGAATTTAGC 1111 

Qy 481 GGAAT GGCCAGAT GCCCATAT GATGCCAAACATGCCAACGTT GCACT GTTT GCAGATGGA 540 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I 
Db 1112 GGAAT GGCCAGAT GCCCTTAT GATGCCAAACATGCCAACATCGCTCT GTTT GCAGAT GGA 1171 

Qy 541 AAACT AT ACT CAG C CAC AGT GACT GACT T C CT T GC CAT T GAC GCAGT CAT T T ACCGGAGT 600 

I I I I I Mill II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1172 AAACT CT ACT C GGCT ACAGT GACT GACTT T CT GG C CAT T GAT GCAGT CAT T T ACAG GAGC 1231 

Qy 601 CT T GGAGAAAGC C CTAC C CT GC GGAC C GT CAAGCAC GAT T CAAAAT GGTT GAAAGAACC A 660 

II IMM I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1232 CT CGGAGACAGC C CT ACC CTC AGGACT GT CAAGC AT GAT T CAAAGT GGTT GAAAGAGC C G 12 91 

Qy 661 T ACTT T GT T CAAG C C GT GGAT T AC GGAGATT AT AT CT ACT T CT T CT T CAGGGAAAT AGC A 72 0 

M I I I I I I I I I I II I I I I I II I II II I I I I I I I I I I II I I I I I II I I I I I I III 
Db 1292 TACTTTGTCCAAGCCGTGGATTATGGGGACTATATCTACTTCTTCTTCAGAGAAATTGCA 1351 

Qy 721 GT G GAGT AT AAC AC CAT GGGAAAG GT AGT TT T C C CAAGAGT GGCT C AGGT T T GT AAGAAT 78 0 

II II II I I I I I I I II I I I I II I I I I I I I I II I II I I I I I I I I I I I I I I I I I 
Db 1352 GTAGAATAC AAC ACT AT GGGGAAGGT T GTT T T C C CT AG GGT GG CT CAGGT CT GTAAGAAT 1411 

Qy 7 81 GATAT GGGAGGAT CTCAAAGAGTCCT GGAGAAACAGT GGACGT CGTTCCT GAAGGCGCGC 84 0 

II I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I II I I I I I I I III 
Db 1412 GACAT GG GAG GGT CT C AGAGAGT C CT GGAGAAG CAGT G GAC AT CT T T C CT GAAG GCTC GC 1471 

Qy 841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
Db 1472 CTGAACTGCTCGGTGCCTGGAGACTCTCATTTTTATTTCAATATACTCCAGGCAGTTACA 1531 

Qy 901 GAT GT GAT T C GT AT CAAC GGG C GT GAT GT T GTC CT GGCAAC GT TT T CT AC ACCT T AT AAC 960 



1532 GAT GT GAT T CGCATTAAT G GCC GT GAT GT T GT CT TGG CAAC CT T T T C CAC AC CT T ATAAC 1591 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 
I I I I I I I I II I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I III 

1592 AGCAT CC CAGGT T CT GCAGT CT GT G C CT AT GAC ATGCT T GACAT T GCTAAT GTT T T CACT 1651 

1021 GGGAGATT CAAGGAACAGAAGT CT CCTGATT CCACCT GGACACCAGTT CCTGAT GAAC GA 1080 

I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I II I I II I I 

1652 GGGAGGT T CAAGGAACAGAAAT CAC CT GACT CT AC C T GGAC AC C C GT T C C AGAC GAAC GA 1711 

1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1712 GTCCCTAAGCCCAGGCCAGGCTGTTGTGCTGGATCATCCTCTTTAGAAAAATATGCAACC 1771 

1141 T C CAAT GAGTT C C CT GAT GAT AC C CT GAACT TC AT CAAGAC GCAC CC GCT CAT GGAT GAG 12 00 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I III 

17 72 T C CAAT GAGTT T CC C GAT GATACCCT GAACTTCATTAAGACGCAT CCACT CATGGACGAG 1831 

12 01 GCAGT GC C CT C CAT CT T CAAC AGGC C AT GGT T C C T GAGAACAAT GGT C AGAT AC C GCCT T 12 60 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 

1832 G CAGT GC CT T C CAT CAT CAACAGAC CTT GGT T C CT GAGAACAAT GGT C AGAT AC C GC CT G 18 91 

1261 AC CAAAAT T GCAGT GGAC ACAG C T G CT GGGC C AT AT C AGAAT CAC ACT GT GGTTTTTCTG 1320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

18 92 AC CAAAAT T GCAGT AGACAACG C T GC C GGGC CAT AT CAGAAT CAC ACT GT GGTTT T CCT G 1951 

1321 GGAT CAGAGAAGGGAAT CAT CT T GAAGTT T T T G GCCAGAAT AGGAAAT AGT GGT T T T CT A 1380 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III 

1952 GGAT CAGAAAAGGGAAT CAT CCT GAAGT T CT T GGCCAGGAT AGGAAG CAGT G GT T T CCT A 2011 

1381 AAT GACAGC CT T T T C CT GGAG GAGAT GAGT GTT T ACAACT CTGAAAAAT GCAGCT ATGAT 14 40 

I I I I I I I I I I II I I I I I I I I I I I I II I II I I I I I I I I I II II I I I I I I I I I I I II 
2012 AAT GGCAGC CT T T T C CT GGAGGAGAT GAAT GT T TACAAC C CAGAAAAGT GCAGCT AT GAT 2071 

1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCTGGACAGAGCAAGCAGCT CTCTGT AT 1500 

II II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I II III 
2072 G GT GT AGAAGACAAAAGGAT CAT GGG CAT GCAG CTC GAC AGAGC GAGT GG CT CACT CT AT 2131 

1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I M I 

2132 GT T GCATT CT CT ACTT GT GT GAT CAAGGT GCCT CTT GGCCGCT GT GAGC GACAT GGGAAG 2191 

1561 T GTAAAAAAAC CTGT ATT GC CT C CAGAGAC CC AT AT T GT GGAT G GAT AAAGGAAG GT GGT 1620 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I - I I I III I I I I I I I I I 

2192 TGTAAAAAAACCTGCATCGCCTCCAGAGACCCGTATTGTGGGTGGGTAAGGGAAAGTGGT 2251 

1621 GCCT GCAGCCATTTAT CACCCAACAGCAGACT GACTTTT GAGCAGGACATAGAGCGT GGC 1680 

I I I I MM I I I I I I I II II I M I II I I I I II I I I I I I I II I I I I II M I 

2252 T CCT GT GCCCAT CT GT CACCCCTTAGCAGACT GACATTT GAGCAGGACATT GAGCGTGGC 2311 

1681 AAT ACAGAT G GT CT GGGG GACT GT CACAAT TC CT TT GT G G CACT GAAT GG GCAT T CCAGT 1740 

I I I II I I I I II II I I I I I I I I I I I I I I I I I II I I II II I II I I I I I I I II I I 

2312 AATACGGACGGCCTAGGAGACTGTCACAATTCCTTCGTGGCACTGAATGGGCACGCCAGT 2371 



1741 TCCCTCTTGCC CAGC ACAACC ACAT CAGAT T C GAC GGCT CAAGAGG GGT AT GAGT CT AGG 1800 
I I II I II I II I II II II II II I I I II II I I I III I I I I I II I I I I I I II 



Db 



2372 TC C CT CTAT C CC AGCAC CACTAC GT CAG AT T C GG C AT C C C GAGAC GG GT AT GAGT CT AGG 2431 



Qy 1801 GGAG GAAT GCT G GACT GGAAGCAT CT G CT T GACT CAC CT GAC AGCAC AGAC CCTTTGGGG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2432 GGAGGCATGCTGGACTGGAACGACCTGCTCGAGGCACCTGGCAGCACAGACCCTTTGGGG 2491 

Qy 1861 GCAGT GT CTT CCCATAAT CACCAAGACAAGAAGGGAGT GATT C GGGAAAGTTACCTCAAA 1920 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2492 GCAGT GT CCT CT CATAACCACCAGGACAAGAAGGGAGTGATTCGGGAAAGTTACCTCAAA 2551 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 198 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2552 AGCAACGACCAGCTTGTTCCTGTCACCCTCCTGGCCATTGCAGTCATTCTGGCTTTTGTC 2 611 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2 04 0 

I I I I I I I I II I I I I II I I I I I I I I I III II II II II I II I I I I I I I I I I I I I I 
Db 2612 ATGGGGGCCGTCTTCTCGGGCATCATCGTGTATTGTGTGTGCGATCACCGGCGCAAAGAC 2 671 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I II ! I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2672 GT GG CAGT AGT GCAGCGCAAGGAGAAAG AGCT C ACT C ACT C G C GT C GG GGAT CT AT GAGC 2731 

Qy 2101 AG C GT CAC CAAG CT CAGC G G CCT CTTT GGGGAC ACT CAAT C CAAAGAC C CAAAGCC G GAG 2160 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III 

Db 27 32 AGTGTCACCAAGCTCAGTGGCCT CTTT GGGGACACCCAGTCCAAGGACCCAAAGCCT GAG 27 91 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 27 92 GC CAT CCT CAC AC C ACT CAT GC ACAAC G GCAAGC T GG C CAC G C CT AGCAACAC C GC CAAG 2851 

Qy 2221 AT GCT CAT TAAAGC AGAC CAGC AC CAC CT GGAC CT G AC GGC C CT CC C CACC C CAGAGT CA 228 0 

I I I I II I I II II I I I I I I I I I I I I I I I I I I II Mill I I I I I I I I I I I I I I 
Db 2852 AT GCT CAT CAAGG CT GAC CAG CAT CAC CTAGAC CT CAC CGCCCTGCC C ACC C CAGAGT C C 2 911 

Qy 22 81 AC C C CAAC GCT GC AGC AGAAGC GGAAGC C CAGC C GC GGCAGC C G C GAGT GG GAG AGG AAC 2340 

I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 
Db 2912 AC C C CGAC ACT GCAGC AGAAAC G GAAAC C CAACC GC GGCAGT C GCGAGT GGGAGAG GAAC 2971 

Qy 2341 C AGAAC CT CAT CAAT GC CT GC ACAAAGGAC AT GC C C C C CAT GGGCT C C C CT GT GAT T C C C 24 00 

I M I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II II 
Db 2972 CAGAACATCATCAATGCCTGCACCAAGGACATGCCTCCCATGGGTTCCCCTGTGATTCCC 3031 

Qy 24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 3032 ACGGACCTGCCCCTCCGGGCCTCCCCAAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 3091 

Qy 2461 AC G CAGCAGGGCT ACC AGCAT GAGT AC GT GGAC C AGC C CAAAAT GAGC GA GGTGGCC 2517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 
Db 3092 AC G CAG CAGGG CTACCAG CAC GAGT AC GTAGAT C AGC C CAAAAT GAGC GAGGT GGT GGCT 3151 

Qy 2518 CAGAT GGC GCT GGAGGAC CAGG C CGCC ACACT GGAGT ATAAGACCAT CAAGGAAC AT CT C 2577 

I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II II 

Db 3152 CAGAT G GC ACT GGAGGAC CAG GCT GC CAC C CT GGAGT AT AAGAC CAT CAAAGAGC AC CT G 3211 

Qy 257 8 AG CAGCAAGAGT C CCAAC CAT G GGGT GAAC CT T GT GGAGAAC CTGGACAGC CT GC C C C CC 2 637 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 3212 AGT AG CAAGAGT C CCAAC CAT GG GGT GAAC CT T GT G GAGAAC CT G GAC AGC CT GC C C C CT 3271 



Qy 2638 AAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGT 2697 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3272 AAAGTTCCACAGCGCGAGGCCTCCCTAGGTCCCCCGGGAACCTCACTGTCACAGACCGGC 3331 

Qy 2698 CTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGC 2757 

II I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I III I II I I I I I M I I I M 

Db 3332 CT GAGCAAGAGGCT GGAGAT GCAACACT CCT CCTCCTAT GGGCTCGAAT ATAAGAGGAGC 3391 

Qy 2758 T AC C CC AC GAACT C GCT CAC GAGAAGC C ACCAGGC CAC C ACT CT CAAAAGAAAC AAC ACT 2817 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I III 
Db 3392 TACCCCAC GAACT CGCT CACAAGAAGCCACCAGAC CACCACT CT CAAAAGAAACAATACT 3451 

Qy 2 818 AACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCG 2877 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3452 AACTCCTCCAATTCCTCCCACCTCTCCAGGAACCAGAGCTTTGGCCGGGGAGACAACCCA 3511 

Qy 2 878 CCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAG 2937 

II I I I II I I I I I I I I I I I I I II I I II II I I I I I I I I I I II I I I M I I I I I I I I I I I 

Db 3512 CCCCCCGCCCCGCAGCGGGTGGACTCTATCCAGGTGCACAGCTCCCAGCCCTCTGGCCAG 3571 

Qy 2938 GCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGG 2997 

I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 3572 GC C GT GACT GT T T C GAGGCAGC C CAGC C T CAAT GC C T ACAACT CACT GAC GAGGT C GGGG 3631 

Qy 2998 CTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCA7\ACCATCCTTTGCTCCCCTT 3057 

I I I II II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I 1 I I 1 I I I I t 1 

Db 3632 CTGAAGCGCACCCCCTCGCTAAAGCCAGATGTACCCCCCAAACCTTCCTTTGCTCCCCTT 3691 

Qy 3058 T C CAC AT C CAT GAAGC C CAAT GAT G C GT GT AC AT AA 3093 

I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 3692 T C CAC AT C CAT GAAGC C CAAT GAT GCAT GT ACATAA 3727 
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Location/ Qualifiers 

1. .3018 

/organism="Mus musculus" 

/mol_type="mRNA" 

/db_xref="taxon: 10090" 

/ tissue_type="brain" 

1. .3018 

/ codon_start-l 

/product="axon guidance signal SEMA6A1" 
/protein_id="AAG29494 . 1" 
/db__xref="GI: 11093909" 

/ trans lation="MRPAALLLCLTLLHCAGAGFPEDSEPI SI SHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNRTLWAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDTLFVCGTNAFNPSCRNYRVDTLETFGDEFS 
GMARCPYDAKHWIALFADGKLYSATVTDFLAIDAVIYRSPGDSPTLRTVKHDSKWLK 
E P Y FVQAVD YG D Y I Y F FFRE I AVE YNTMG KWF P RVAQVC KN DMGG S QRVL E KQWT S F 
LKARLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDMLD 
IADVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLEKYATSNEFPDDTLNFI 
KTHPLMDEAVPSIINRPWFLRTMVRYRLTKIAVDNAAGPYQNHTWFLEEMNVYNPEK 
CSYDGVEDKRIMGMQLDRASGSLYVAFSTCVIKVPLGRCERHGKCKKTCIASRDPYCG 
WVRESGSCAHLSPLSRLTFEQDIERGNTDGLGDCHNSFVALNGHASSLYPNTTTSDSA 
SRDGYESRGGMLDWNDLLEAPGSTDPLGAVSSHNHQDKKGVI RESYLKSNDQLVPVTL 
LAI AVI LAFVMGAVFS GI IVYCVCDHRRKDVAWRRKEKELTHSRRGSMS SVSELSGL 
FGDTQSKDPKPEAILTPLMHNGKLATSSNTAKMLIKADQHHLDLTALPTPESTPTLQQ 
KRKPNRGSREWERNQNIINACTKDMPPMGSPVIPTDLPLRASPSHIPSVWLPITQQG 
YQHEYVDQPKMSEWAQMALEDQAATLEYKTTKEHLSSKSPNHGVNLVENLDSLPPKV 
PQREASLGPPGTSLSQTGLSKRLEMQHSSSYGLEYKRSYPTNSLTRSHQTTTLKRNNT 
NSSNSSHLSRNQSFGRGDNPPPAPQRVDSIQVHSSQPSGQAVTVSRQPSLNAYNSLTR 
SGLKRTPSLKPDVPPKPSFAPLSTSMKPNDACT" 



ORIGIN 



Query Match 78.1%; Score 2414.8; DB 10; Length 3018; 

Best Local Similarity 87.3%; Pred. No. 0; 

Matches 2703; Conservative 0; Mismatches 312; Indels 81; Gaps 



2; 



QY 
Db 



ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 6 0 

III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I 

ATGCGGCCAGCAGCCTTACTGCTGTGTCTCACACTGCTACACTGCGCCGGGGCGGGTTTC 60 



QY 
Db 

Qy 

Db 

Qy 

Db 



6 1 C CAGAAGAT T CT GAGC CAAT C AGTAT T T C GCAT GG CAACT AT ACAAAAC AGT AT C C GGT G 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M 
61 C CAGAAGAT T C C GAGC CAAT CAGT ATT T C G CAT GGCAACTAT ACAAAAC AGT AT C C GGT G 

12 1 TTT GT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 

I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I 
121 T T T GT G GGC CACAAGC CAGGAC G GAACAC CAC GCAGAGGCACAGGC T GGACAT CCAGAT G 

181 ATT AT GAT CAT GAAC GGAACC CT CTAC AT T GCT GC T AGG GAC CAT ATT TAT ACT GT T GAT 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I II II I 
181 AT CAT GAT CAT GAACAGAACCCTCTACGTTGCTGCTCGAGAC CATATTT ATACTGTTGAT 



120 



120 



180 



180 



240 



240 



Qy 

Db 



241 AT AG AC AC AT CAC AC AC G G AAGAAAT T TAT T GT AG C AAAAAAC T GAC AT G G AAAT C T AG A 300 

I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
241 AT AGAC ACAT CC CAC ACAGAAGAAATTT ACT GTAGCAAAAAACT GACAT GGAAAT CTAGA 300 



Qy 301 CAG GC C GAT GT AGAC ACAT G CAGAAT GAAGGGAAAACAT AAGGAT GAGT GC C ACAACT T T 360 

I I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I II I I I I II I I I I I I I I 

Db 301 CAGGCT GAC GTAG AC ACAT G CAGGAT GAAGGGGAAACAT AAGGAT GAAT GT C ACAACT T C 360 

Qy 361 ATTA7\AGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 42 0 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AT T AAAGTT CTT CT CAAGAAGAAT GAT GAT AC GC T GTTTGTCTGTG GAAC CAAT GC CT T C 42 0 

Qy 421 AACCCTT CCTGCAGAAACT ATAAGAT GGATACATTGGAACCATT CGGGGAT GAATT CAGC 4 80 

I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I III 

Db 421 AAC CCT T C C T GC AGAAACT ACAGGGT C GAT AC CT T GGAAACTT T T GGGGAT GAATT TAGC 48 0 

Qy 481 GGAATGGC CAGATGCC CATATGAT GC CAAACAT GCCAACGTT GCACT GTTT GCAGAT GGA 540 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 

Db 481 GGAAT G GC CAGAT GC C CTT ATGAT G C CAAACAT GT CAAC AT CGCTCTGTTTG C AGAT GGA 54 0 

Qy 541 AAACTATACT CAGCCACAGT GACT GACTT C CTT GCCATT GACGCAGT CATTT ACCGGAGT 600 

M I I I I I I I I II I I I I I I I M I I I I I II I I I I I I I I II I I I I I I I I I I I I I 

Db 541 AAACTCT ACT CGGCTACAGT GACTGACTTT CT GGCC ATT GAT GC GGT CATTT ACAGGAGC 600 

Qy 601 CT T GGAGAAAGC C CT AC CCT GC G GAC C GT CAAGCAC GAT T CAAAAT GGT T GAAAGAACCA 660 

I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 601 C C C GGAGACAGC C CT AC CCT CAGGAC T GT CAAGCAT GAT T CAAAGT G GT T GAAAGAG CC G 660 

Qy 661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 72 0 

I I I I II I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I II I I I I I I I I I I Ml 

Db 661 T ACTTT GT C CAAGCC GT GGATT AT GGGGACT ATAT CTACTT CTT CTT CAGAGAAATT GCA 720 

Qy 721 GT GGAGT AT AAC ACCAT G GGAAAGGT AGTT TT C C CAAGAGT GGCT C AGGT TT GT AAGAAT 78 0 

II II II I I I I I I II I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I 

Db 721 GT AGAATACAACACT ATGGGAAAGGTT GTTTT CC CT AGGGTGGCT CAGGT CT GT AAGAAT 78 0 

Qy 781 GATATGGGAGGAT CT CAAAGAGTCCT GGAGAAACAGT GGACGT C GTT CCTGAAGGCGCGC 84 0 

II I I M I I I I Mill I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I III 

Db 781 GACAT GGGAGGGTCT CAGAGAGT CCT GGAGAAGCAGT GGACAT CTTT CCT GAAGGCTCGC 84 0 

Qy 841 T T GAACT GCT CAGTT C CT G GAGACT CT CAT TT T TAT T T CAAC AT T CT C C AGG CAGTTACA 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I M 

Db 841 CT GAACT G CT CGGT G C CT GGAGACT CT CAT TT TT AT T T CAAT AT ACT C C AGGCAGT T ACA 900 

Qy 901 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

I I I I I I I I I I I II II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 GATGTGATTCGCATTAATGGCCGTGATGTTGTCTTGGCAACCTTTTCCACACCTTATAAC 960 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I M I II II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I III 

Db 961 AGCATCCCAGGTTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCTGATGTTTTCACT 1020 

Qy 1021 GGGAGATT CAAG GAACAGAAGT CT C CT GAT T C CAC CT GGAC AC C AGTT C CT GAT GAAC GA 1080 

Mill I II I I I II II I I I I II I I I I I II I I I I II I I I I I I I I I I II I I II I I 

Db 1021 G GGAGGT T CAAGGAACAGAAAT CAC CT GACT CT AC CT GGAC AC CC GTT C CAGACGAAC GA 1080 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGA7\AGATATGCAACC 1140 

II II I I I M I I I I I I I I I I II I I II I II I I I II I II I I I I II I I II I I I I I I I I 

Db 1081 GTCCCTAAGCCCAGGCCAGGCTGTTGTGCTGGATCATCCTCTTTAGAAAAATATGCAACC 1140 



Qy 

Db 



1141 T CCAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GC AC CC G CT C ATGGAT GAG 1200 

I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M 
1141 TCCAAT GAGTT TCCCGAT GATAC CCTGAACTTCATTAAGACGCAT CCACT CATGGACGAG 1200 



Qy 1201 GCAGT GC C CT C CAT CTT CAACAG GC CAT GGTT CCT GAGAACAAT G GT CAGAT AC C GC CT T 1260 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 GCAGT GC CTT C CAT CAT CAAC AGAC CT T GGT T CCT GAGAACAAT GGT CAGAT AC C GC CT G 1260 

Qy 12 61 ACCAAAAT T GCAGT GGACACAGCT GCT G GGC CAT AT CAGAAT C ACACT GTGGTTTTTCTG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I 

Db 12 61 AC CAAAAT T GCAGTAGACAAC GCT GCC G GG C CAT AT CAGAAT CACACT GT GG 1312 

Qy 1321 G GAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GGC CAGAAT AGGAAATAGT GGT T TT CT A 1380 

Db 1313 1312 

Qy 1381 AAT GACAGCCT TT T CCT GGAGGAGAT GAGT GTTT ACAACT CT GAAAAAT GC AGCT AT GAT 144 0 

I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 1313 T TT T C CT GGAGGAGAT GAAT GT TT ACAACCCAGAAAAGT GC AGCT AT GAT 1362 

Qy 14 41 G GAGT C GAAGACAAAAGGAT CAT G GGC AT GCAG C T GGACAGAG CAAGCAGCT CT CT GT AT 1500 

II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II III 

Db 1363 GGT GTAGAAGACAAAAGGAT CAT GGGCATGCAGCT CGACAGAGCGAGT GGCT CACTCTAT 1422 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I MINIMUM 
Db 1423 GTTGCATTCTCTACTTGTGTGATCAAGGTGCCTCTTGGCCGCTGTGAGCGACATGGGAAG 1482 

Qy 1561 T GT AAAAAAAC CT GT AT T GC CT C C AGAGAC CCAT AT T GT GGAT G GAT AAAGGAAG GT G GT 162 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I II I I II I I I I I I I M 
Db 1483 TGTAAAAAAACCTGCATCGCCTCCAGAGACCCGTATTGTGGGTGGGTAAGGGAAAGTGGT 1542 

Qy 1621 GC CT GC AGC C ATT TAT C AC C CAACAGC AGACT GACT T TTGAGC AGGACAT AGAGC GT GGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I II I I I 

Db 1543 T C CT GT G CCC AT CT GT C AC C C CT TAG C AGACT GACAT T T GAGC AGGACAT T GAGC GT GGC 1602 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 174 0 

I II I I II II II II I I I I I I I I I I I I M I I I I I I I I I I I II II I I I I I I I I I I 
Db 1603 AATACGGACGGCCTAGGAGACTGTCACAATTCCTTCGTGGCACTGAATGGGCACGCCAGT 1662 

Qy 1741 TCCCTCTTGCC C AG CACAAC CACAT CAGAT T CGACGGCT CAAGAGGGGT AT GAGT CT AGG 1800 

I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1663 TCCCT CTAT CCCAACAC CACTAC GTCAGATT CGGCATCCCGAGACGGGTATGAGT CT AGG 1722 

Qy 1801 GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 1860 

I I I I I I I I I II I I I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1723 GGAGGCATGCTGGACTGGAACGACCTGCTCGAGGCACCTGGCAGCACAGACCCTTTGGGG 1782 

Qy 1861 GCAGT GT CT T C C CAT AAT C AC CAAGAC AAGAAGGGAGT GAT T C GGGAAAGT T AC CT CAAA 1920 

I II I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1783 GCAGT GT CCT CT CAT AAC CACCAGGACAAGAAGGGAGTGATTC GGGAAAGTTAC CT CAAA 18 42 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

II I I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I I I II II I I I I I I II III 

Db 1843 AGCAACGACCAGCTTGTTCCTGTCACCCTCCTGGCCATTGCAGTCATTCTGGCTTTTGTC 1902 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 



1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1903 ATGGGGGCCGTCTTCTCGGGCATCATCGTGTATTGTGTGTGCGATCACCGGCGCAAAGAC 1962 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

Mill II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 

Db 1963 GTGGCAGTAGTGCGGCGCAAGGAGAAAGAGCTCACTCACTCGCGTCGGGGATCTATGAGC 2022 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

II III II I I II I I I I I M I I I I I I I I I I I II II I | | | | I I I I I I I I I I I III 

Db 2023 AGTGTCTCCGAGCTCAGTGGCCTCTTTGGGGACACCCAGTCCAAGGACCCAAAGCCTGAG 2082 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I Mill I I I II II I I I I II I 
Db 2083 GCCATCCTCACACCACTCATGCACAACGGCAAGCTGGCCACGTCTAGCAACACCGCCAAG 2142 

Qy 2221 AT GCT C AT TAAAG CAGAC CAG CAC CAC CT G GAC CT GAC GGC CCT C C C CAC C C CAGAGT CA 228 0 

I I I I I I I I II II I I I I I I I I II I I I II II I II I I I I I I I I I I I I I II I I I I 
Db 2143 AT GCT CAT CAAGG CT GAC CAGCAT CAC CTAGAC CT CAC CGC CCT GC C CAC C C CAGAGT CC 22 02 

Qy 22 81 ACC C CAAC GC T GC AGC AGAAGCGGAAG C C CAGC C GC GGCAGCC GC GAGT GG GAGAGGAAC 234 0 

Mill II I I I I I I II I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I III I II 
Db 22 03 ACC C CGACACT GC AGC AGAAACGGAAAC C CAAC CGC GGCAGT CGC GAGT GG GAGAGGAAC 2262 

Qy 2341 CAGAAC C T CAT CAAT G C CT G CACAAAG GAC AT GC C C C C CAT GGGCT C C CCT GT GATT C CC 24 00 

I I I I I I I II I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I II I I I 

Db 2263 CAGAAC AT CAT CAAT G C CT GCAC CAAG GACAT G C CT CC CAT GGGT T C C CCT GT GATT C CC 2322 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I I I I I I I I I II I I I II I I. II I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 

Db 2323 ACGGACCTGCCCCTCCGGGCCTCCCCAAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2382 

Qy 2461 AC GCAG CAG GGCT ACCAGC AT GAGT AC GT GGAC CAGCC CAAAAT GAGC GA GGTGGCC 2517 

II I I I I I I I I M I II I I I I I I I I I II I I II I I I I I I I I I I I I I II I I II I I I I 

Db 2383 AC GCAG C AGGGCT ACCAG CAC GAGT AC GT AGAT CAG CC CAAAAT GAG C GAG GT GGT G GCT 2442 

Qy 2518 CAGAT GGCGCT GGAGGAC C AGGC C GCC AC ACT GGAGT AT AAGAC CAT CAAG GAACAT CT C 2577 

I I I I I I I I I I II I II I I I I II I I I I I I I I I I I I I I I I I II I II II I II II II 

Db 2443 CAGAT GGCACT GGAGGAC CAG GCT GC C AC C CT GGAGT AT AAGAC CAC CAAAGAGCAC CT G 2502 

Qy 2578 AGCAGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCC 2637 

II II I I I II I I I I I II I I I I I II I I I I I M I I I II I II I II I II I I M I I I I M I I I 

Db 2503 AGTAGTAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCT 2562 

Qy 2638 AAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGT 2697 

I I I I I I I M I II I I I I I I I I I I II I I I I II I I I I I I I II I I I I I I I I I I I I I II 

Db 2563 AAAGTTCCACAGCGCGAGGCCTCCCTAGGTCCCCCGGGAACCTCACTGTCACAGACCGGC 2622 

Qy 2 698 CTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGC 2757 

II M I I I I I M I I I I I I I I I I I I I II I I I I I I I III I II I I I I I I I I I I I I 

Db 2 623 CT GAGCAAGAGGCT GGAGAT GCAACACT CCT CCTCCTATGGGCT C GAATATAAGAGGAGC 2682 

Qy 2758 TAC C CC AC GAACT C GCT CAC GAGAAGC CAC CAGGCCAC CACTCT CAAAAGAAACAAC ACT 2817 

I II I I I I II I I I I I I I II I I I I I I I I I I I I II M I II I I I I I I I I I I I I I I I M III 
Db 2 683 TACCCCACGAACT C GCT CACAAGAAGCCAC CAGAC CAC CACTCT CAAAAGAAACAAT ACT 2742 

Qy 2 818 AACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCG 2877 

I I II I I I I I II I I I II I II I I I I I I I I I M I I I II I I I I M I I I I I I II I II I I I I 



Db 



2743 AACTCCTCCAATTCCTCCCACCTCTCCAGGAACCAGAGCTTTGGCCGGGGAGACAACCCA 28 02 



Qy 2878 CCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAG 2937 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2803 CCCCCCGCCCCGCAGCGGGTGGACTCTATCCAGGTGCACAGCTCCCAGCCCTCTGGCCAG 2 8 62 

Qy 2 938 GCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGG 2997 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2863 GCCGTGACTGTTTCGAGGCAGCCCAGCCTCAATGCCTACAACTCACTGACGAGGTCGGGG 2922 

Qy 2998 CTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTT 3057 

I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I II I I 
Db 2 923 CTGAAGCGCACCCCCTCGCTAAAGCCTGATGTACCCCCCAAACCTTCCTTTGCTCCCCTT 2982 

Qy 3058 T C CAC AT C CAT GAAGC C CAAT GAT GC GT GT AC ATAA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 983 T C CAC AT C CAT GAAGC C CAAT GAT GC GT GT AC ATAA 3018 
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BC062979 4139 bp mRNA linear ROD ll-DEC-2003 

Mus musculus seraa domain, transmembrane domain (TM) , and 
cytoplasmic domain, (semaphorin) 6A, mRNA (cDNA clone MGC: 86119 
IMAGE: 6841689) , complete cds . 
BC062979 

BC062979.1 GI:38566245 
MGC. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
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Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 
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Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: Plate: Row: Column: 0. 

Location/Qualifiers 

1. .4139 

/organism-"Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6" 

/db_xref="taxon: 10090" 

/clone="MGC: 86119 IMAGE: 6841689" 

/tissue_type="Brain" 

/ cl on e_l ib= " N I H_BMAP_GH 0 " 

/lab_host="DH10B" 

/note="Vector : pYX-ASC" 

1. .4139 

/ gene= " S eitia 6a " 

/note="synonyms : Via, sema, Sema6A-l, A730020P05Rik" 

/db_xref="LocusID: 20358" 

/db_xref="MGI: 1203727" 

248. .3178 

/ codon_start=l 

/product="Sema6a protein" 

/protein_id="AAH62979. 1" 

/db_xref="GI: 38566246" 

/db_xref="LocusID: 20358" 

/translation="MRPAALLLCLTLLHCAGAGFPEDSEPISISHGNYTKQYPVFVGH 
KPGRNTTQRHRLDIQMIMIMNRTLYVAARDHIYTVDIDTSHTEEIYCSKKLTWKSRQA 
DVDTCRMKGKHKDECHNFIKVLLKKNDDTLFVCGTNAFNPSCRNYRVDTLETFGDEFS 
GMARCPYDAKH7\NIALF7VDGKLYSATVTDFLAIDAVIYRSLGDSPTLRTVKHDSKWLK 
E P Y FVQAVD YGD Y I Y F FFRE I AVE YNTMG KWF P RVAQVC KN DMG G S Q RVLE KQWT S F 
LKARLNCSVPGDSHFYFNILQAVTDVIRINGRDWLATFSTPYNSIPGSAVCAYDMLD 
IANVFTGRFKEQKSPDSTWTPVPDERVPKPRPGCCAGSSSLEKYATSNEFPDDTLNFI 
KTHPLMDEAVPSIINRPWFLRTMVRYRLTKIAVDNT^AGPYQNHTWFLGSEKGIILKF 
LARIGSSGFLNGSLFLEEMNVYNPEKCSYDGVEDKRIMGMQLDRASGSLYVAFSTCVI 
KVPLGRCERHGKCKKTCIASRDPYCGWVRESGSCAHLSPLSRLTFEQDIERGNTDGLG 
DCHNSFVALNGVIRESYLKSNDQLVPVTLLAIAVI LAFVMGAVFSGIIVYCVCDHRRK 
DVAVVQRKEKELTHSRRGSMSSVTKLSGLFGDTQSKDPKPEAI LTPLMHNGKLATPSN 



misc feature 



misc feature 



TAKMLIKADQHHLDLTALPTPESTPTLQQKRKPNRGSREWERNQNIINACTKDMPPMG 
SPVIPTDLPLRASPSHIPSVWLPITQQGYQHEYVDQPKMSEWAQMALEDQT^ATLEY 
KTIKEHLSSKSPNHGVNLVENLDSLPPKVPQREASLGPPGTSLSQTGLSKRLEMQHSS 
SYGLEYKRSYPTNSLTRSHQTTTLKRNNTNSSNSSHLSRNQSFGRGDNPPPAPQRVDS 
IQVHSSQPSGQAVTVSRQPSLNAYNSLTRSGLKRTPSLKPDVPPKPSFAPLSTSMKPN 
DACT" 

413. .1678 

/note="Sema; Region: semaphorin domain" 
/db_xref ="CDD: smart00630" 
1787. .1888 

/note="PSI; Region: domain found in Plexins, Semaphorins 

and Integrins" 

/db xref="CDD:smart00423" 



ORIGIN 



Query Match 73.8%; Score 2282.4; DB 10; Length 4139; 

Best Local Similarity 85.3%; Pred. No. 0; 

Matches 2642; Conservative 0; Mismatches 286; Indels 168; Gaps 



2; 



Qy 

Db 



1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 
III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
248 ATGCGGCCAGCAGCCTTACTGCTGTGTCTCACACTGCTACACTGCGCTGGGGCTGGTTTC 307 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



61 CCAGAAGATT CTGAGCCAAT CAGTATTTCGCATGGCAACT ATACAAAACAGTAT CCGGT G 12 0 
I I I I I I I I II I I I I I I I I I I I I I II I I I I ! I I I I II I I I I I I I I I I I I I II I I I I I I I I 
308 C C AGAAGAT T CC GAG C CAAT CAGT AT T T C GCAT GGCAACT AT ACAAAAC AGT AT CC GGT G 367 

121 TTTGT GGGC CACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGAT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

368 TTT GT GGGCCACAAGCCAGGACGGAACACCACGCAGAGGCACAGGCT GGACAT CCAGAT G 427 

181 AT TAT GAT CATGAAC GGAAC C CT CT ACAT T GCT GCT AGGGAC CAT AT TT AT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I I ! I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I 
42 8 AT CAT GAT CATGAACAGAACCCT CTACGTT GCT GCT C GAGACCATATTTATACT GTT GAT 487 

241 ATAGACACAT CACACACGGAAGAAAT TTATTGTAGCAAAAAACTGACAT GGAAATCTAGA 300 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
48 8 ATAGACACAT C C CACACAGAAGAAAT TT ACT GTAGCAAAAAACT GACAT GGAAAT CTAGA 547 

301 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGT GCCACAACTTT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
54 8 C AGGCT GAC GTAGACACAT GCAG GAT GAAGGGGAAACATAAGGAT GAAT GT C ACAACTT C 607 

361 ATT AAAGT T CT T CTAAAGAAAAACGAT GAT GCAT T GT TT GT CT GT GGAAC TAAT GC CTT C 42 0 

I I I II I I I I M I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
608 AT TAAAGT T C T T CTCAAGAAGAAT GAT GAT AC GCT GT TT GT C T GT GGAAC CAAT G C CTT C 667 

421 AAC C CT T C CT GCAGAAACT ATAAGAT G GAT ACAT T G GAAC CAT T C GGG GAT GAAT T CAGC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I II I II I I I III 

668 AAC CCTTCCTG CAGAAACT ACAG GGT C GAT AC CT T GGAAACT TTT GGGGAT GAATT T AGC 727 

481 G GAAT GGC CAGAT GC C CAT AT GAT GC CAAACAT GC CAAC GTT GCACT GT T T GCAGAT GGA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I II I 
72 8 G GAAT GGC CAGAT GC C CTT AT GAT GC CAAACAT GC CAAC AT CGCTCTGTTTG CAGAT GGA 787 



Qy 



541 AAACT ATACT CAG CCACAGT GACT GAC T T C CT T GC CATT GAC GC AGT C ATTT ACC GGAGT 600 
I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I 



Db 



788 AAACTCTACTCGGCTACAGTGACTGACTTTCTGGCCATTGATGCAGTCATTTACAGGAGC 847 



Qy 601 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 848 C T C G GAGACAGCC CTAC C CT CAGGACT GT CAAGC AT GATT CAAAGTG GTT GAAAGAGC C G 907 

Qy 661 T ACT TT GT T CAAGC CGT GGAT T AC GGAGATT AT AT CT ACT T CT T CTT CAGG GAAAT AGC A 720 

I II I I I I I I I I I I I I I I I I II I II II I M I I I I II I I I I I I I I I I I I I I I I Ml 

Db 908 T ACT TT GT C CAAGC CGT GGATT AT GG G GACTAT AT CT ACT T CT T CTT CAGAGAAAT T GCA 967 

Qy 721 GT GGAGT AT AACAC CAT GGGAAAGGT AGT T T T C C CAAGAGT GGCT C AGGT T TGT AAGAAT 780 

II II II I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 968 GTAGAATACAACACTATGGGGAAGGTTGTTTTCCCTAGGGTGGCTCAGGTCTGT AAGAAT 1027 

Qy 781 GATATGGGAGGAT CTCAAAGAGTCCT GGAGAAACAGT GGAC GTC GTT C CT GAAGGC GCGC 84 0 

II MINIM I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 
Db 1028 GACATGGGAGGGT CTCAGAGAGT CCT GGAGAAGCAGT GGACAT CT TT C CT GAAGGCT CGC 1087 

Qy 841 T T GAACT GCT C AGT T C CT G GAGACT CT CAT TTT T AT T T CAACAT T CT C C AG GC AGT T ACA 900 

I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 
Db 1088 CTGAACTGCTCGGTGCCTGGAGACTCTCATTTTTATTTCAATATACTCCAGGCAGTTACA 1147 

Qy 901 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1148 GAT GT GATT C GC AT T AAT GGC CGT GAT GT T GT CT T GGCAAC CT T T T C CACACCT TATAAC 1207 

Qy 961 AG CAT C C CT GGGT CT G CAGT CTGT GC C TAT GAC AT GCT T GACAT T G C CAGT GT T TT TACT 1020 

I M I I I I I II I II I I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I I I III 
Db 12 08 AGCATCCCAGGTTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCTAATGTTTTCACT 12 67 

Qy 1021 GGGAGATTCAAGGAACAGAAGTCT CCT GATT CCACCT GGACACCAGTTCCT GAT GAACGA 1080 

I I I I I I I I I I M I I I II I I II I I I I I II I I I I I I I I I I I I II I I II I I I I I I 

Db 12 68 G G GAG GTT C AAG G AAC AG AAAT C AC C T GAC T C T AC CT G GAC AC C C GT T C C AG AC G AAC GA 1327 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

II I I I I I I II I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1328 GTCCCTAAGCCCAGGCCAGGCTGTTGTGCTGGATCATCCTCTTTAGAAAAATATGCAACC 1387 

Qy 1141 T C CAAT GAGT T CCCT GAT GAT AC C CT GAACT T C ATCAAGAC GCACC C GCT CAT GGAT GAG 12 00 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I 
Db 1388 T C CAAT GAGT T T C C C GAT GAT AC CCT GAAC T T CAT T AAGAC G CAT C C AC T CAT G GAC GAG 1447 

Qy 1201 GCAGT G C C CT C C AT CT T CAACAGGC C AT GGT T C CT GAGAACAAT GGT CAGAT AC C GC CTT 1260 

I I I I II II I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1448 GCAGT GCCT T CC AT CAT CAACAGAC CT T G GTT C CT GAGAACAAT GGT CAGAT AC C GC CT G 1507 

Qy 1261 AC CAAAAT T GCAGT GGAC ACAGC T GCT GGGCCATAT CAGAAT C ACACT GT GGT T TT T CT G 1320 

I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I M I I I I I I I I III 
Db 1508 AC CAAAAT T GCAGT AGACAACGCT GC C GGGCCATAT CAGAAT CACACT GT GGT T T T C CT G 1567 

Qy 1321 GGAT C AGAGAAGGGAAT CAT CT T GAAGTT T TT GGC CAGAAT AG GAAAT AGT GGTT T T CT A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1568 G GAT C AGAAAAGGGAAT CAT CCT GAAGT T CTT GGC CAG GAT AGGAAG CAGT GGT T T C CT A 1627 

Qy 1381 AAT GAC AGCCT TTT C CTGGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT G CAGCT AT GAT 1440 

I I M I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 162 8 AAT G G CAGC CT TTT C CT GGAGGAGAT GAAT GT T T ACAAC C CAGAAAAGT GCAGCT AT GAT 1687 



Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GT AT 1500 

I I II I I I I I I I M I I I I I I I I I I M I I I I I II I I I I I I I I I II I I I I M Ml 

Db 1688 GGT GTAGAAGACAAAAGGAT CAT GGGCAT GCAG C T C GACAGAG C GAGT GGCT CACT CT AT 1747 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1748 GTTGCATTCTCTACTTGTGTGATCAAGGTGCCTCTTGGCCGCTGTGAGCGACATGGGAAG 1807 

Qy 1561 T GTAAAAAAAC CT GT AT T GC CT C CAGAGAC C CAT AT T GT GGAT GGAT AAAGGAAGGT GGT 1620 

I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I III I II I I I I I I I I I 
Db 1808 TGTAAAAAAACCTGCATCGCCTCCAGAGACCCGTATTGTGGGTGGGTAAGGGAAAGTGGT 1867 

Qy 1621 GCCT GCAGC CATT T AT C AC C CAACAGC AG ACT GACTT T TGAGCAGGACAT AGAGC GT GGC 1680 

I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1868 T C CT GT GC C C AT CT GT C AC C C CT T AGC AGACT GACAT T T GAGCAGGACATT GAG CGT GGC 1927 

Qy 1681 AAT ACAGAT G GT CT GGGGGACT GT CACAAT T CCT T T GT GGCACT GAAT GGGCAT T C C AGT 1740 

I I M I II II II II I I I I I I I I I I I I M I I I II I I I II I I I I I 
Db 1928 AAT ACGGAC GGCCTAGGAGACT GT CACAATT CCTT C GT GGCACT GAAT 1975 

Qy 17 41 TCCCTCTTGCC C AGCACAAC CAC AT CAGAT T CGACGGCT CAAGAGG GGT AT GAGT CT AGG 1800 

Db 1976 1975 

Qy 1801 GGAGGAATGCTGGACT GGAAGCAT CT GCTT GACT CACCTGACAGCACAGACCCTTT GGGG 1860 

Db 1976 1975 

Qy 1861 GC AGT GT CT T C C CAT AAT CAC CAAGACAAGAAG GGAGT GAT T C G GGAAAGT TAC CT CAAA 1920 

I I I I I I I I I I II I I I I II I I I I I I I I I 
Db 1976 G GAGT GAT T C GGGAAAGT T AC CT CAAA 2002 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 198 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 2003 AGCAACGACCAGCTTGTTCCTGTCACCCTCCTGGCCATTGCAGTCATTCTGGCTTTTGTC 2062 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I I I I I I I I I I I M I I I I I I II I I I I III II I I I I II I I I I I I I I I I I I I I I I I 

Db 2063 ATGGGGGCCGTCTTCTCGGGCATCATCGTGTATTGTGTGTGCGATCACCGGCGCAAAGAC 2122 

Qy 2 041 GT GGCT GT GGT GCAGC GCAAGGAGAAG GAG CT CAC C CACT CGCGCCGGGGCTC CAT GAGC 2100 

M I I I II I I I I I I I I I I M I I I I I II I I I I I I I I I I II II I I I I I II I I I I I I 
Db 2123 GT GGCAGT AGT G CAG C GCAAG GAGAAAGAGCT CACT CACT CGC GT C GGG GAT CT AT GAGC 2182 

Qy 2101 AGC GT CAC CAAGCT C AGC GGCCTCTTT G GG GACACT CAAT C CAAAGAC C CAAAGC C GGAG 2160 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I Ml 

Db 2183 AGT GT CAC CAAG CT C AGT GG C CT CT T T GGGGACAC C CAGT C CAAGGAC C CAAAGC CT GAG 2242 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 2243 G C CAT C CT CAC AC CACT CAT GCACAACG G CAAG CT G GC CAC G C CT AGCAACAC CG C CAAG 2302 

Qy 2221 AT GCT CAT T AAAG CAGAC CAGC AC CACCT GGAC CT GAC G GC C CT CC CC AC CC CAGAGT C A 2280 

| | | II I I I II M I I I I I M I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2303 AT GCT CAT CAAGGCT GAC CAGC AT CACCT AGAC CT CAC C GC C CT GC C CAC C C CAGAGT C C 2362 



2281 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 234 0 

I I I I I II I I I I I I I I I I I I I I I! I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

2363 ACCCCGACACTGCAGCAGAAACGGAAACCCAACCGCGGCAGTCGCGAGTGGGAGAGGAAC 2422 

2341 CAGAACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 2400 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

2423 C AGAACAT CAT CAAT GCCT GC AC CAAGGACAT GC CT C C CAT GGGTTCCCCTGT GAT T C CC 24 82 

2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 8 3 ACGGACCTGCCCCTCCGGGCCTCCCCAAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2542 

24 61 ACGCAGCAGGGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGA GGTGGCC 2517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 
2543 ACG CAGC AG G G CT AC CAGCAC GAGTAC GT AGAT CAGC C CAAAATGAGC GAGGT GGT GGCT 2602 

2518 CAGAT GGC GCT GGAGGAC CAGG C C GC CACACT G GAGT AT AAGACC AT CAAGGAACAT CT C 2577 

I I I I I I I I I I I I I II I I I M I I I I I I I I I I M I I I I I I I I I I I M I I M M M 
2 603 CAGAT G GC ACT GGAGGAC CAG GCT GC CACCCT GGAGT ATAAGAC CAT CAAAGAGC ACCT G 2 662 

2578 AGC AGCAAGAGT C CCAAC CAT GG GGT GAACCT T GT GGAGAAC CT GGAC AGC CT GC C CCC C 2637 

|| | | | | | | I | M I I I I I I I I II I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I M 
2663 AGTAGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCT 2722 

2 638 AAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGT 2 697 

M M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I II II I I I I I 

2723 AAAGTTCCACAGCGCGAGGCCTCCCTAGGTCCCCCGGGAACCTCACTGTCACAAACCGGC 27 82 

2698 CTAAGCAAGC GGCT GGAAAT GCAC CACT C CT CT T C CT AC GGGGT T GACT ATAAGAGGAGC 27 57 

|| | | | | | | I I I I II I I I I I I I I II I II I I I I I I Ml I M I I II I I I I I I I I 
2783 CT GAGCAAGAGGCT GGAGAT GCAACACT C CT C CT C CT AT GGGCT C GAAT AT AAGAGGAGC 2842 

2758 T AC C C CAC GAACT C G CT C AC GAGAAGCCAC C AGGCC AC CACTCT CAAAAGAAACAACACT 2 817 

I I I I I M M I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I II I I I I I I 
2843 T AC C C CAC GAACT C GCT CACAAGAAGCC AC C AGAC CAC CACT CT CAAAAGAAACAAT ACT 2902 

2818 AACT C CT C CAATT C CT CT CAC CT CTCCAGAAAC CAGAGCTTT GG C AGGG GAGACAAC C C G 2 877 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I 

2903 AACTCCTCCAATTCCTCCCACCTCTCCAGGAACCAGAGCTTTGGCCGGGGAGACAACCCA 2 962 

2878 CCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAG 2937 

|| I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2963 CCCCCCGCCCCGCAGCGGGTGGACTCTATCCAGGTGCACAGCTCCCAGCCCTCTGGCCAG 3022 

2938 GCCGT GACT GTCTCGAGGCAGCCCAGCCTCAACGCCTACAACT CACT GACAAGGTCGGGG 2997 

M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I II I I I 

302 3 GCCGTGACTGTTTCGAGGCAGCCCAGCCTCAATGCCTACAACTCACTGACGAGGTCGGGG 3082 

2998 CTGAAGCGTACGCCCTCGCTA7^VGCCGGACGTACCCCCC7WVCCATCCTTTGCTCCCCTT 3057 

I I I I I I I I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I M I 

3083 CTGAAGCGCACCCCCTCGCTAAAGCCAGATGTACCCCCCAAACCTTCCTTTGCTCCCCTT 3142 

3058 TC CACAT CCAT GAAGCCCAAT GAT GCGT GTACATAA 3093 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
314 3 T C CACAT C CAT GAAG C C CAAT GAT GC AT GTACATAA 3178 



Search completed: March 26, 2004, 03:40:51 
Job time : 12317 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



March 25, 2004, 19:45:25 ; Search time 1238.51 Seconds 

(without alignments) 
10609.274 Million cell updates/sec 

US-09-856-681A-1 
3093 
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3862 


3 


AAD01233 


Aad01233 
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3038 


98.2 


3498 


3 


AAA93617 


Aaa93617 


3 


3038 


98.2 


3498 


8 


ADA23280 


Ada23280 


4 


3032 


98.0 


4280 


7 


ABX71103 


Abx71103 


5 


3025.6 


97. 8 


4250 


8 


ADA23361 


Ada23361 


6 


2969.6 


96.0 


6060 


4 


AAH18729 


Aahl8729 


7 


2746.2 


88.8 


3550 


2 


AAV44295 


Aav44295 



.on 



Human s em 
Human s em 
cDNA enco 
Novel hum 
cDNA enco 
Human cDN 
Human sec 



8 


2746.2 


88. 


8 


3550 


5 


AAF98469 


Aaf98469 


Human cDN 


9 


2698 


87. 


2 


3333 


3 


AAA93618 


Aaa93618 


Human sem 


10 


2698 


87. 


2 


3333 


8 


ADA2 3282 


Ada23282 


cDNA enco 


11 


2221. 8 


71. 


8 


3039 


5 


AAS68807 


Aas68807 


DNA encod 


12. 


2221.8 


71. 


8 


3039 


5 


AAS89721 


Aas89721 


DNA encod 


13 


2182.4 


70. 


6 


3041 


4 


AAH17625 


Aahl7625 


Human cDN 


14 


1881.6 


60. 


8 


1890 


3 


AAA93630 


Aaa93630 


Human s em 


15 


1881. 6 


60. 


8 


1890 


8 


ADA23359 


Ada23359 


cDNA enco 


16 


1881.6 


60. 


8 


1890 


8 


ADA23306 


Ada23306 


cDNA enco 


17 


1824.4 


59. 


0 


2293 


4 


AAH15834 


Aahl5834 


Human cDN 


18 


1742.4 


56. 


3 


2227 


4 


AAK94365 


Aak94365 


Human ful 


19 


1666.4 


53. 


9 


2306 


4 


AAH17861 


Aahl7861 


Human cDN 


20 


1592 


51. 


5 


2592 


5 


AAS68253 


Aas68253 


DNA encod 


21 


1462 


47. 


3 


2123 


4 


AAH13995 


Aahl3995 


Human cDN 


22 


1367.2 


44. 


,2 


4564 


8 


ACH03994 


Ach03994 


Human cDN 


23 


1216 


39. 


3 


2262 


6 


ABK34739 


Abk34739 


Human cDN 


24 


962 


31. 


, 1 


1054 


2 


AAX84066 


Aax84066 


Human ZSM 


25 


808.4 


26. 


, 1 


1047 


2 


AAX84076 


Aax84076 


Mouse ZSM 


26 


788 


25. 


,5 


839 


4 


AAH05402 


Aah05402 


Human cDN 


27 


758.6 


24, 


,5 


814 


4 


AAK93983 


Aak93983 


Human cDN 


28 


758.6 


24. 


.5 


814 


4 


AAK92027 


Aak92027 


Human cDN 


29 


751.2 


24. 


.3 


780 


4 


AAH05580 


Aah05580 


Human cDN 


30 


742. 6 


24, 


.0 


788 


4 


AAK93916 


Aak93916 


Human cDN 


31 


708.8 


22. 


.9 


963 


2 


AAX84067 


Aax84067 


Degenerat 


32 


686. 8 


22. 


.2 


963 


2 


AAX84077 


Aax84077 


Degenerat 


33 


669 


21. 


.6 


4234 


6 


ABA00055 


Aba00055 


CADHP-2 c 


34 


661.6 


21. 


. 4 


3205 


6 


ABS64380 


Abs64380 


Human sem 


35 


657.4 


21, 


.3 


662 


4 


AAH08370 


Aah08370 


Human cDN 


36 


657.4 


21, 


. 3 


1923 


4 


AAH42598 


Aah42598 


Partial c 


37 


657.4 


21, 


. 3 


3694 


4 


AAH42597 


Aah42597 


Nucleotid 


38 


642 


20, 


.8 


2191 


6 


ABS64381 


Abs64381 


Human sem 


39 


642 


20, 


.8 


2359 


6 


ABS64383 


Abs64383 


Human sem 


40 


642 


20 


. 8 


3196 


6 


ABS64382 


Abs64382 


Human sem 


41 


642 


20 


. 8 


3364 


6 


ABS64384 


Abs64384 


Human sem 


42 


640. 6 


20 


.7 


889 


5 


AAS68806 


Aas68806 


DNA encod 


43 


577.4 


18 


. 7 


1896 


6 


ABS64379 


Abs64379 


Human sem 


44 


577.4 


18 


.7 


2014 


6 


AAD38696 


Aad38696 


Human LP2 


45 


570. 8 


18 


.5 


786 


4 


AAH05233 


Aah05233 


Human cDN 



ALIGNMENTS 



RESULT 1 
AAD01233 

ID AAD01233 standard; DNA; 3862 BP. 
XX 

AC AAD01233; 
XX 

DT 04-OCT-2000 (first entry) 
XX 

DE Human semaphorin 6A-1 cDNA. 
XX 

KW Human; semaphorin 6A-1; (HSA) SEMA6A-1 ; neuronal development; apoptosis; 

KW neuronal regeneration; Ena/VASP protein family; immunomodulatory; 

KW gene therapy; diagnostic agent; therapeutic agent; differentiation; 

KW cytoskeletal stabilisation; plasticity; ds . 



XX 
OS 
XX 
FH 
FT 
FT 



Homo sapiens . 



Key 
CDS 



Location/Qualifiers 
658. .3750 
/*tag= a 

/product^ "Human semaphorin 6A-1" 

/note= "This region is specifically claimed as SEQ ID NO: 
1 in claim 1" 
3532. .3747 
/*tag= b 

/note= "Encodes the binding domain of semaphorin 6A-1 
which selectively binds to members of Ena/VASP protein 
family" 



FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 



misc feature 



XX 

PN WO200031252-A1. 
XX 

PD 02-JUN-2000. 
XX 

PF 26-NOV-1999; 99WO-EP0 092 15 . 
XX 

PR 26-NOV-1998; 98EP-00122441 . 
XX 

PA (PLAC ) MAX PLANCK GES FOERDERUNG WISSENSCHAFTEN . 
XX 

PI Behl C, Klostermann A; 
XX 

DR WPI; 2000-400065/34. 

DR P-PSDB; AAY71460. 
XX 

PT Nucleic acid coding for human semaphorin 6A-1 used as diagnostic agent, 

PT therapeutic agent, for modulating immune system, in gene therapy or for 

PT effecting differentiation, cytoskeletal stabilization and/or plasticity. 
XX 

PS Claim 1; Fig 2; 53pp; English. 
XX 

CC The present sequence is a cDNA encoding transmembranous human semaphorin 

CC 6A-1 ( (HSA) SEMA6A-1) which is involved in neuronal development and 

CC regeneration mechanisms during apoptosis. Semaphorin is a family of 

CC proteins displaying secreted or transmembrane-based repulsive guidance 

CC cues critically involved in neuronal development. The present sequence 

CC was isolated from human 1-ZAP Express cDNA library which was screened 

CC using a PCR fragment amplified from human neuroblastoma cell line SK-N-MC 

CC cDNA. The (HSA) SEMA6A-1 protein contains a Zyxin-like domain that 

CC selectively binds to members of Ena/VASP protein family especially Evl . 

CC Expression of (HSA) SEMA6A-1 is highest in embryonic brain and kidney and 

CC moderate in lung. The present sequence is useful as diagnostic and 

CC therapeutic agents, for modulating the immune system, in gene therapy, 

CC for effecting differentiation, cytoskeletal stabilisation and plasticity 

XX 

SQ Sequence 3862 BP; 971 A; 1111 C; 967 G; 813 T; 0 U; 0 Other; 

Query Match 100.0%; Score 3093; DB 3; Length 3862; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3093; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 



658 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 717 

61 C CAGAAGAT T CT GAGCCAAT C AGT ATT T C GC AT GGCAACT ATACAAAACAGT AT C C GGT G 120 
I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
718 CCAGAAGATT CT GAGCCAAT CAGTATTT CGCATGGCAACTATACAAAACAGTAT CC GGT G 777 

121 T T T GT GG GC CACAAG CC AGGAC GGAACAC C ACACAGAG G C ACAGG C T GGAC AT C CAGAT G 180 

I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
778 T T T GT GGGCCACAAGCC AGGAC G GAACAC C ACACAGAGGCACAG GCT GGAC AT C CAGAT G 837 

181 AT TAT GAT CAT GAAC GGAAC C C T CT ACAT T GC T GCT AG G GAC CAT ATT TAT ACT GT T GAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I 
838 AT TAT GAT CAT GAAC GGAAC C CT CT ACATT GCT GCT AGGGAC CAT AT T TAT ACT GT T GAT 8 97 

2 41 AT AGACACAT CACACAC GGAAGAAATT TAT T GT AGCAAAAAACT GAC AT G GAAAT CT AGA 300 

M I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
8 98 AT AGACACAT CACACACGGAAGAAATTTATT GTAGCAAAAAACT GACATGGAAATCT AGA 957 

301 CAGG C C GAT GT AGACACAT G CAGAAT GAAGGGAAAACAT AAGGAT GAGT GC C ACAACT T T 360 

I | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
958 CAGGC CGAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAG GAT GAGT GC CACAACT T T 1017 

361 ATT AAAGT TCTT CT AAAGAAAAAC GAT GAT GCATT GT T T GT CT GT GGAACT AAT G CCT T C 420 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1018 ATT AAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GTT T GT CT GT GGAAC TAAT GCCTT C 1077 

421 AAC C CT T C CT GCAGAAACT ATAAGAT G GAT ACAT T GGAAC CAT T C GGGGAT GAATT CAGC 480 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1078 AAC C CT T C CT G C AGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T C GGGGAT GAAT T CAGC 1137 

4 81 GGAATGGCCAGAT GCCCATATGAT GCCAAACAT GC CAACGTTGCACT GTTT GCAGAT GGA 540 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I 
1138 GGAATGGCCAGAT GCCCAT AT GAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 1197 

541 AAAC TAT ACT CAGC CACAGT GACT GACT T C CTT GC CAT T GACG CAGT CAT T T AC C GGAGT 600 
I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I II I I 
1198 AAACT AT ACT CAG C CACAGT GACT GACTT C CTT GC C AT T GACGC AGT CATT T AC CGGAGT 1257 

601 CT T G GAGAAAGC C CT AC CCT GC GGACCGT CAAGCAC GATT CAAAAT GGTT GAAAGAAC CA 660 
I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1258 CT T GGAGAAAG C C CT AC CCT GC GGAC C GT CAAGCAC GATT CAAAAT GGTT GAAAGAAC CA 1317 

661 T ACT T T GT T CAAGC C GT GGAT T AC G GAGAT T AT AT CT ACT T CTT CT T CAGGGAAAT AGC A 720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M 
1318 T ACT T T GTT CAAGCC GT GGATTAC GGAGAT T AT AT CT AC TT CT T CT T CAGG GAAAT AGC A 1377 

721 GT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T C C CAAGAGT GG CT C AGGT T T GT AAGAAT 780 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II 
1378 GT GGAGTAT AACAC CAT GG GAAAGGT AGTT T T C CCAAGAGT GGCTC AGGT T T GTAAGAAT 1437 

781 GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGAC GT C GT T CCT GAAGGCGCGC 84 0 
I | | | | | || | | | | | | | I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1438 GAT AT GGGAGGAT CT CAAAGAGTCCT GGAGAAACAGT GGACGT CGTT CCTGAAGGCGCGC 14 97 

841 TT GAACT GCT CAGTT C C T G GAGACT CT CAT TTT T AT T T CAAC AT T C T CCAGGC AGTT AC A 900 
I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 



Db 14 98 T T GAACT GCT C AGT T CC T GGAGACT CT CAT T T TT ATT T CAACAT T C T C CAG GCAGTT ACA 1557 

Qy 901 GAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT CCT GGCAAC GTT T T CT ACAC CT TATAAC 960 

I I I I I I M I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1558 GAT GT GAT T C GTAT CAAC GGGC GT GAT GTT GT CCT GGCAAC GTTT T CT ACAC CT TATAAC 1617 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 

Db 1618 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1677 

Qy 1021 GGGAGAT T C AAGGAACAGAAGT CT C CT GATT C CAC CT GGAC AC CAGT T CCT GAT GAAC GA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 167 8 GGGAGATT CAAGGAACAGAAGT CT CCT GATTCCACCT GGACACCAGTT CCT GAT GAACGA 1737 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I 
Db 1738 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1797 

Qy 1141 T C CAATGAGT T C CCT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC C C G CT C AT GGAT GAG 1200 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1798 T C CAATGAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC CC G CT CAT G GAT GAG 1857 

Qy 1201 GCAGT GC C CT C CAT C T T CAAC AGGC CAT GGT T CCT GAGAACAAT GGT C AGATAC C G C CT T 1260 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1858 GCAGT GC C CT C CAT CT T CAAC AGGCCAT G GT T CCT GAGAACAAT GGT C AGATAC CG C CT T 1917 

Qy 12 61 ACCAAAATTGCAGT GGACACAGCT GCT GGGCCATAT CAGAAT CACACTGTGGTTTTTCTG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I 
Db 1918 AC CAAAAT T G CAGT G GACACAG CT GCT GGGC CAT AT CAGAAT CAC ACT GT GGTTTT T CT G 1977 

Qy 1321 GGAT CAGAGAAG GGAAT CAT CT TGAAGT T TT T GGC CAGAAT AGGAAAT AGT GGTTT T CTA 1380 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I 

Db 197 8 GGAT CAGAGAAGGGAAT CAT CT T GAAGT T TT T GGC CAGAAT AGGAAAT AGT GGTTT T CTA 2 037 

Qy 1381 AAT GACAGC C TT TT C CT GGAG GAGAT GAGT GT T T ACAACT CT GAAAAAT G C AGCT AT GAT 1440 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 038 AAT GACAGCCTT TT C CT GGAGGAGAT GAGT GT TT ACAACT CT GAAAAAT G C AGCT AT GAT 2097 

Qy 14 41 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCTCT CT GTAT 1500 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 

Db 2098 G GAGT CGAAGACAAAAGGAT CAT GG GCAT GCAGCT GGACAGAGCAAGC AG CT CT CT GTAT 2157 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I II I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I 
Db 2158 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 2217 

Qy 1561 T GTAAAAAAAC CT GT AT T GC CT CCAGAGAC C CAT AT T GT GGAT GGAT AAAGGAAG GT GGT 1620 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2218 T GTAAAAAAAC CT GT ATT GC CT CCAGAGAC C CAT AT T GT GGAT GGAT AAAGGAAGGT GGT 2277 

Qy 1621 GC CT GCAGCCATTT AT CAC C CAAC AGC AGACT GAC TT T T GAGCAG GAC AT AGAGC GT GGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 227 8 GCCT GCAGCCATTT AT CACCCAACAGCAGACT GACTTTT GAGCAGGACATAGAGCGT GGC 2337 

Qy 1681 AAT ACAGATGGT CT G GG GGAC T GT CAC AAT T C CT T TGT GGC ACT GAAT G GG CAT T C CAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2338 AAT ACAGAT GGT CT G GGGGACT GT CACAAT T C CT T T GT GG C ACT GAAT GGG CAT T C CAGT 2397 



Qy 1741 TCCCTCTTGCC CAG CACAAC C ACAT CAGATT C GAC GG CT CAAGAGGGGT AT GAGT C T AGG 1800 

I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2398 T C CC T CT T GC C CAGCACAAC C ACAT CAGATT C GAC GGCT CAAGAGGGGT AT GAGT CT AG G 2457 

Qy 18 01 GGAGGAAT GCT GGACTGGAAGCAT CT GCT TGACT CACCT GACAGCACAGACC CTT T GGGG 1860 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2458 G GAGGAAT GCT GGACT G GAAG CAT CT GCT T GACT C AC CT GAC AG CACAGAC CCTTTGGGG 2517 

Qy 1861 G CAGT GT CT T C C CAT AAT CAC CAAGACAAGAAGG GAGT GAT T C G GGAAAGT T ACCT CAAA 1920 

I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2518 GCAGT GT CT T C C CAT AAT CAC CAAGAC AAGAAGGGAGT GATT C GGGAAAGT T ACC T CAAA 2577 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I II I I I I I I I I I I II I I I I I I I I I I I I 
Db 257 8 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2 637 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2638 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2697 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2698 GT GGCT GTGGTGCAGCGCAAGGAGAAGGAGCT CAC CCACTCGCGCCGGGGCTCCATGAGC 2757 

Qy 2101 AGCGT CAC CAAGCT C AG CGGCCTCTT T GGGGACAC T CAAT C CAAAGAC C CAAAGC C GGAG 2160 

I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2758 AGCGT CAC CAAGCT C AGC G GC CT CT T T GG GGACAC T CAATC CAAAGAC C CAAAGC C GGAG 2 817 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 
Db 2818 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2 8 77 

Qy 2221 AT GCT CAT T AAAGC AGAC CAGC AC CACCT GGAC CT GAC GGC C CT C C CC AC C C CAGAGT CA 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 287 8 AT GCT CATT AAAGC AGAC CAGC AC CACCT GGAC CT GAC GGC C CT C C CC AC C C CAGAGT CA 2937 

Qy 2281 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2938 AC CCCAAC GCT GCAGCAGAAGCGGAAGCC CAGC CGCGG CAGC CGC GAGT GGGAGAGGAAC 2997 

Qy 2341 CAGAACCT CAT CAAT GCC T GC ACAAAGGACAT GC C C CC CAT GGGCTCCCCTGT GAT T C C C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2998 CAGAACCT CAT CAAT GCC T GC ACAAAGGACAT GC C C CC C AT GGGCT C C C C T GT GAT T C CC 3057 

Qy 24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3058 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 3117 

Qy 2461 AC GC AGC AGG GCT AC CAG CAT GAGT ACGT GGAC C AGCC CAAAAT GAGC GAGGT GG C CC AG 2520 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3118 ACGCAGCAGGGCTAC CAGCAT GAGT ACGT GGACCAGCCCAAAATGAGCGAGGT GGCCCAG 3177 

Qy 2521 AT GGCGCT GGAGGACCAGGCCGCCACACT GGAGTATAAGACCATCAAGGAACATCT CAGC 2580 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3178 AT GGCGCT GGAGGAC CAGGCCGCCACACT GGAGTATAAGACCATCAAGGAACATCT CAGC 3237 



Qy 2581 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3238 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 3297 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3298 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 3357 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I | I | | I I I I I I I I I I 
Db 3358 AGCAAG C G GC T GGAAAT G CAC CACT C CT CT T C CT ACGG GGT T GACT ATAAGAG GAGCT AC 3417 

Qy 2761 C CC AC GAACT C GCT CAC GAGAAGC CAC CAGG C CAC CACT CT CAAAAGAAACAAC ACT AAC 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 3418 C CC AC GAACT C GCT CAC GAGAAGC CAC CAGGC CACCACTCT CAAAAGAAACAACACTAAC 3477 

Qy 2 821 T CCT C CAAT T C CT CT CAC CT CT C C AGAAAC C AGAGCT T T GG CAG GGGAGAC AAC C CGC C G 2 88 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I 

Db 3478 T CCT C CAATT C CT CT CAC CT CT C C AGAAAC C AGAG CT T T GG CAGGGGAGACAAC C CGC C G 3537 

Qy 28 81 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I II 
Db 3538 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 3597 

Qy 2941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 3598 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3657 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3658 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3717 

Qy 3061 ACAT C CAT GAAGC CCAAT GAT GC GT GT ACATAA 3093 

I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I 

Db 3718 ACAT C CAT GAAGC C CAAT GAT GC GT GT ACATAA 3750 
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XX 
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XX 

CC Sequences AAA93616-A93631 and AAA93673-A93676 represent nucleic acids 

CC which encode human SECX proteins (AAB23029-B23048 ) . The SECX proteins of 

CC the invention are either secreted or membrane-associated proteins and act 

CC as regulator of cellular proliferation and differentiation. SECX proteins 

CC or nucleotides are useful for diagnosing the presence of, or 

CC predisposition to, a disease associated with altered levels of SECX 

CC proteins and nucleotides. The SECX proteins are also useful to screen 

CC compounds that modulate SECX activity or expression. The interaction of a 

CC SECX protein with other cellular proteins may be useful to modulate the 

CC activity of a partner protein, cellular proliferation, cellular 

CC differentiation and cell survival. SECX nucleotides are useful for the 

CC recombinant expression of SECX protein, and may be used detect SECX mRNA 
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CC SECX expression (e.g., using antisense oligonucleotides). SECX nucleic 

CC acid sequences are also useful for identifying a cell or tissue type in a 

CC biological sample, and in forensic biology. SECX primers or probes are 

CC useful for detecting the presence of SECX nucleotides and for screening 

CC tissue cultures for contamination. Diseases that may be treated or 

CC prevented using SECX proteins or nucleotides include cancer (e.g., 

CC colorectal carcinoma, prostate cancer) , benign tumours, immune disorders 

CC (including autoimmune diseases, transplant rejection, allergies, AIDS), 

CC infections, inflammatory disorders, arthritis, haematopoietic disorders, 

CC skin disorders, cardiovascular disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g., Alzheimer's disease), trauma (e.g., surgical 

CC or traumatic wounds, spinal cord injury), and skeletal disorders 

XX 
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Query Match 98.2%; Score 3038; DB 3; Length 3498; 

Best Local Similarity 99.3%; Pred. No. 0; 
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Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

Qy 61 C CAGAAGAT T CT GAGC CAAT C AGT AT T T C GCATG GCAACT AT ACAAAACAGTAT C C GGT G 120 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 C CAGAAGAT T CT GAGC CAAT C AGT AT T T C GCAT G GCAAC TAT ACAAAACAGTAT C C GGT G 333 

Qy 121 T T T GT GGGCCACAAGCCAGGAC GGAAC AC CACAC AGAGGCACAGG C T G GAC AT C C AGAT G 180 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I II 

Db 334 T T T GT GGGC CACAAGCCAGGAC GGAAC AC CACAC AGAGG CACAGGCT GGAC AT C CAGAT G 393 

Qy 181 AT TAT GAT CAT GAAC GGAAC C CT CT AC AT TG CT GCTAGG GAC CAT AT T TAT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I II I I I II I M I I I 

Db 394 AT TAT GAT CAT GAAC GGAAC C CT CT AC AT T G CT GCT AG GGACC AT AT T TAT ACT GTT GAT 4 53 

Qy 241 ATAGACACATCACACACGGAAGAAATTT ATT GTAGCAAAAAACTGACAT GGAAAT CTAGA 300 

I I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 
Db 454 ATAGACACAT CACACACGGAAGAAATTT ATT GTAGCAAAAAACT GACAT GGAAAT CTAGA 513 

Qy 301 CAGGC CGATGTAGACACATGCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 360 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 514 CAGGC C GAT GTAGAC ACAT GC AGAAT GAAGGGAAAACATAAGGAT GAGT GC CACAACT T T 573 

Qy 361 AT T AAAGT T CTT CT AAAGAAAAAC GAT GAT GCAT T GTTT GT CT GT GGAACTAAT GC CT T C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 574 AT T AAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GTTT GT CT GT GGAACTAAT GC CTT C 633 

Qy 421 AACCCTT CCTGCAGAAACTATAAGAT GGATACATT GGAACCATT C GGGGAT GAATT CAGC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 634 AAC C CTT C CT GCAGAAACT ATAAGAT G GAT ACAT T GGAAC CAT T C GGGGAT GAAT T CAG C 693 

Qy 481 GGAAT GGCCAGATGCCCATATGAT GCCAAACATGC CAACGTT GCACTGTTT GCAGATGGA 54 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GGAAT GGC CAGAT G C CCAT AT GAT GC CAAACATG C CAAC GTT GC ACT GT TT GCAGAT GGA 753 

Qy 541 AAACT AT ACT CAGC CACAGT GACT GACT T CCTT GC CATT GAC GC AGT CATT TAC C GGAGT 600 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 754 AAACT AT ACT CAGC CACAGT GACT GACT T CCTT GC CAT T GAC GC AGT CATT TAC C G GAGT 813 

Qy 601 CTT GGAGAAAG C CCT AC C CT G C GGAC C GT CAAGCAC GAT T CAAAAT G GT T GAAAGAAC CA 660 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 814 CTT GGAGAAAGC CCT AC C CT G C GGAC C GT CAAGCAC GAT T CAAAAT G GT T GAAAGAAC CA 873 

Qy 661 T ACTT T GT T CAAGC C GT GGAT TAC GGAGATTAT AT CT ACTT CT T CT T CAGGGAAAT AG CA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 874 T ACT T T GT TCAAGC C GT GGAT TAC GGAGATTAT AT CT ACTT CT T CT T CAGGGAAAT AGCA 933 

Qy 721 GT GGAGT AT AACAC CAT GGGAAAGGTAGTTTT CC CAAGAGT GGCT CAGGTTTGTAAGAAT 780 

I I I II I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 934 GT GGAGT AT AACAC CAT GGGAAAGGTAGTTTT CCCAAGAGT GGCT CAGGTTTGTAAGAAT 993 

Qy 781 GAT AT GGGAGGAT C T CAAAGAGT CCT GGAGAAAC AGT GGAC GT C GT T C CT GAAGG C GC GC 840 

I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 94 GAT AT GGGAGGAT CT CAAAGAGT C CT G GAGAAACAGT GGACGT C GT T C CT GAAGGC GC G C 1053 



Qy 841 T T GAACT G CT C AGT T C CT G GAGACT C T CAT T TTT AT T T CAACAT T CT C CAGGC AGTT ACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1054 T T GAACT GCT CAGT T C CT G GAGACT C T CAT T TTT AT T T CAACAT T CT C CAGGC AGTTACA 1113 

Qy 901 GAT GT GAT TC GTAT CAAC G GGCGT GAT GTT GT C C T G GCAAC GT T TT CT AC AC CT T AT AAC 960 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1114 GAT GT GAT TC GTAT CAAC GGGCGT GAT GTT GT C C T GG CAAC GT T T T CT ACAC CT TAT AAC 1173 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1174 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1233 

Qy 1021 GGGAGATT CAAGGAACAGAAGTCTCCT GATT CCACCT GGACACCAGTT CCT GAT GAAC GA 1080 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 12 34 GGGAGATT CAAGGAACAGAAGTCT CCT GATT CCACCT GGACACCAGTT CCT GAT GAAC GA 12 93 

Qy 10 81 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGA7UVGATATGCAACC 114 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I 

Db 12 94 GTT C CT AAG C C CAG GC C AGGT T G CT GT GCT G GCT CAT C CT C CTTAGAAAGAT AT GCAAC C 1353 

Qy 1141 TCCAAT GAGTT CCCTGAT GATACCCT GAACTTCATCAAGAC GCACCC GCT CAT GGAT GAG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1354 T C CAAT GAGT T CC CT GAT GAT AC CCT GAACT T CAT CAAGAC GC AC C C GCT CAT G GAT GAG 1413 

Qy 12 01 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1414 GCAGTGC CCT C CAT CTT CAACAGGCCAT GGTTCCTGAGAACAAT GGT CAGATACC GCCTT 1473 

Qy 12 61 AC CAAAAT T GCAGT GGACACAGCT GC T G G GC CAT AT C AGAAT CACACT GTGGTTTTTCTG 1320 

I I I I I I M I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 14 74 AC CAAAAT T G CAGT GGACACAGCT GCT GG GC CAT AT C AGAAT CACACT GT GGT T T TT CTG 1533 

Qy 1321 GGAT CAGAGAAGGGAAT CAT CTT GAAGTTTT TGGCCAGAATAGGAAATAGTGGTTTT CTA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1534 GGAT CAGAGAAGGGAAT CAT CTT GAAGTTTTTGGCCAGAATAGGAAATAGTGGTTTT CTA 1593 

Qy 13 81 AAT GACAGCCTTTT CCT GGAGGAGAT GAGT GTTTACAACT CTGAAAAATGCAGCTATGAT 144 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1594 AAT GACAGCCTTTT CCT GGAGGAGAT GAGT GTTTACAACT CTGAAAAATGCAGCTATGAT 1653 

Qy 14 41 GGAGT CGAAGACAAAAGGAT CAT GGG CAT GCAG CT G GAC AGAGCAAG CAGCT CT CT GT AT 1500 

I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I M I I I I I I I I I 

Db 1654 GGAGT C GAAG ACAAAAGGAT CAT G GGC AT GCAGCT GGAC AGAGCAAGCAGCT CT CT GTAT 1713 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1714 GT T GC GTT CT CT AC CT GT GT GAT AAAGGT T C C C C TT GGC C GGT GT GAAC GACAT GGGAAG 1773 

Qy 1561 T GT AAAAAAACCT GT AT TG C CT C CAGAGAC C CAT AT T GT GGAT GGAT AAAGGAAGGT G GT 162 0 

I I I I I I M I I I I I I I M I II I I I I I I I I I I I I I II I II I I I I I M I I I I I I I I I I I I I I I 

Db 1774 TGT AAAAAAACCT GTAT T GC CT C CAGAGAC C CAT AT T GT GGAT GGAT AAAGGAAGGT GGT 1833 

Qy 1621 GC CT G CAGC CAT T TAT CAC C CAACAGC AGACT GACT T TT GAGCAGGACAT AGAG C GT GGC 1680 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1834 GC CT GCAGC CAT T TAT CAC C CAACAG CAGACT GACT T TT GAGCAGGACAT AGAGC GT GGC 18 93 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 17 4 0 



Db 18 94 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 1953 

Qy 17 41 TCCCTCTTGCC CAGCAC AAC C ACAT CAGAT T C GAC GGCT CAAGAGGGGT AT GAGT CT AG G 18 00 

I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1954 TCCCTCTTGCC CAGCACAAC C ACAT CAGAT T C GAC GGCT CAAGAGGGGT AT GAGT CT AGG 2 013 

Qy 18 01 GGAGGAAT GCT GGACT GGAAGCAT CT GCT T GACT CAC CT GACAGCACAGAC CCTTTGGGG 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2014 GGAGGAAT GCT GGAC T GGAAGCAT CT G CT T GACT CAC CT GACAGCACAGAC CCTTTGGGG 2073 

Qy 18 61 GCAGT GT CTT CC CATAAT CACCAAGACAAGAAGGGAGT GATT CGGGAAAGTTACCT CAAA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2074 GCAGT GT CTT CC CATAAT CACCAAGACAAGAAGGGAGT GATT CGGGAAAGTTACCT CAAA 2133 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2134 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2193 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2194 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2253 

Qy 2041 GT GGCT GT GGT GCAGCGCAAGGAGAAGGAGCT CACCCACT CGCGC C GGGGCT CCAT GAGC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2254 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2313 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2314 AGC GT CAC CAAGCT CAG C GGC CT CT TT G GGGAC ACT CAAT C CAAAGAC C CAAAGC C GGAG 237 3 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 1 I I I I I I I I II I I I I I II I I I I I I I 

Db 2374 GCCATCCTCACGCCACTCATGCACAACGGCTUVGCTCGCCACTCCCGGCAACACGGCCAAG 2433 

Qy 2221 AT G CT C AT T AAAGCAGAC CAGCAC CACCT GGAC CT GACGGC C CT C CC C AC C C CAGAGT CA 22 80 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I II I I I I 
Db 2434 ATGC T C ATTAAAGCAGAC CAG CAC CAC CT GGAC CT GAC GG C CCT C CC C AC C C CAGAGT CA 24 93 

Qy 2281 AC C C CAACGCT GC AGCAGAAGCGGAAGC C C AGC C GC GGCAGCC GC GAGT GGGAGAGGAAC 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2494 ACCCCAACGCTGCAGCAGAAGCGGGAACCCAGCCGCGGCACCCGCGAGTGGGAGAGGAAC 2553 

Qy 2341 CAGAAC C T CAT CAAT GC CT G CACAAAGGACAT GC C C C CCAT GGGCT CC CCT GT GAT T C CC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2554 CAGAAC CT CAT CAAT GC CT GCACAAAGGAC AT GC C C C C CAT GGGCT C C CCT GT GATT C CC 2613 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I 

Db 2 614 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2673 

Qy 24 61 AC GCAGCAGG GC T ACC AGC AT GAGT AC GT GGAC CAGC C CAAAAT GAG C GAG GT GGCC CAG 252 0 

I I I I I I M I I I I I I I I I I I I I I I II I I II I II I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 2674 AC G CAGCAG GGCT AC CAGC AT GAGT AC GT G GAC CAGC C CAAAAT GAGC GAGGT GGCC CAG 2733 

Qy 2521 AT GG CG CTGGAG GAC C AGG C C GC CACACT GGAGT ATAAGACCAT CAAG GAACAT CT C AG C 258 0 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 



Db 2 734 AT GG CGC T G GAGGAC C AGG CC GCCACACT GGAGT AT AAGAC CAT C AAG GAAC AT CT C AGC 2793 

Qy 2581 AGCAAGAGT C C CAACC AT GGGGT GAAC CTT GT G GAGAAC C T GGACAG CCTGCCCCC CAAA 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2794 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 2853 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

I I I M I I I I I I I I I I I I I 1 I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 854 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2913 

Qy 27 01 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2 914 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2973 

Qy 2761 CC C ACGAACT C GCT CAC GAGAAGC CAC CAGG CC ACC - ACT CT CAAAAGAAACAACACT AA 2819 

I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 974 CCCACGAACT CGCT CACGAGAAGCCAC CT GACCACCTACT CTCATCAGAAGCAACACTAA 3033 

Qy 2 820 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 287 8 

Ml I I I I I I III II II I I I I I I I II I I I I II I I I I I I I I I I I I I I I 

Db 3034 CC C C GACAAT TCAN CT CT GACT T CAAAGGGACC AGAGCT T T G GC AGG GGAGACAAC C C GC 3093 

Qy 2 879 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2 938 

I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 11 I I I I I I I I I I I II I I I I I II I I I 
Db 3 094 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 3153 

Qy 2939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 

M I I I I M I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3154 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3213 

Qy 2999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I I I I I I M I I I I I I II I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3214 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3273 

Qy 3059 C CAC AT C CAT GAAGC C C AAT GAT GC GT GT AC AT AA 3093 

I I I I I II I I II I II I I I I I I I I I I I M I I I I I I I I 

Db 3274 CCACATCCAT GAAGCCCAAT GAT GCGT GT ACATAA 3308 



RESULT 3 
ADA23280 

ID ADA23280 standard; cDNA; 3498 BP. 
XX 

AC ADA23280; 
XX 

DT 20-NOV-2003 (first entry) 
XX 

DE cDNA encoding human SECX polypeptide, SEC2 . 
XX 

KW Human; secreted polypeptide; membrane-associated polypeptide; SECX; SEC1; 

KW SEC 2 ; SEC3; SEC4; SEC5; SEC6; SEC7; SEC8; SEC9; SEC10; SEC11; SEC12; 

KW SEC13; SEC14; SEC15; SECX-associated disorder; lung cancer; 

KW cardiovascular disease; oncology disease; immune disorder; 

KW autoimmune disease; transplant rejection; allergy; AIDS; infections; 

KW inflammatory disorder; arthritis; haematopoietic disorder; skin disorder; 

KW atherosclerosis; restenosis; neurological disease; Alzheimer's disease; 

KW trauma; wounds; spinal cord injury; skeletal disorder; cytostatic; 



KW antiinflammatory; immunosuppressive; anti-HIV; antiarthritic; 

KW antiarteriosclerotic; cardiant; neuroprotective; nootropic; vulnerary; 

KW antiallergic; cardiant; dermatological ; gene; ss. 
XX 

OS Homo sapiens. 
XX 

PN US2003054514-A1. 
XX 

PD 20-MAR-2003. 
XX 

PE 19-SEP-2001; 2001US-00957187 . 
XX 

PR 09-MAR-1999; 

PR 04-JAN-2000; 

PR 08-MAR-2000; 

PR 19-SEP-2000; 

PR 20-SEP-2000; 
XX 

PA (SHIM/) SHIMKETS R A. 

PA (LARO/) LAROCHELLE W J. 
XX 

PI Shimkets RA, Larochelle WJ; 
XX 

DR WPI; 2003-540616/51. 

DR P-PSDB; ADA23281. 
XX 

PT New SECX nucleic acids, useful for treating or diagnosing a disorder 

PT e.g., lung cancer, cardiovascular and oncology diseases, immune disorder, 

PT and autoimmune disease. 

XX 

PS Claim 3; Fig 2; 118pp; English. 
XX 

CC The present invention relates to the isolation of human secreted or 

CC membrane-associated (SECX) polypeptides designated SEC1-SEC15, and the 

CC polynucleotide sequences encoding them. Also disclosed is a method for 

CC screening for a modulator of activity or latency of SECX. The SECX 

CC polypeptide and polynucleotide sequences may be used for treating or 

CC preventing SECX-associated disorders such as lung cancer, cardiovascular 

CC and oncology diseases, immune disorders, autoimmune diseases, transplant 

CC rejection, allergy, AIDS, infections, inflammatory disorders, arthritis, 

CC haematopoietic disorders, skin disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g. Alzheimer's disease), trauma, wounds, spinal 

CC cord injuries, and skeletal disorders. The present sequence encodes a 

CC SECX polypeptide of the invention. 
XX 

SQ Sequence 3498 BP; 917 A; 966 C; 889 G; 725 T; 0 U; 1 Other; 

Query Match 98.2%; Score 3038; DB 8; Length 3498; 
Best Local Similarity 99.3%; Pred. No. 0; 

Matches 3072; Conservative 0; Mismatches 21; Indels 2; Gaps 2; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

Qy 61 CCAGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT GGCAACT AT ACAAAACAGT AT C C GGT G 120 
I M I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



99US-0123667P. 
2000US-0174485P. 
2000US-00520781. 
2000US-0233798P. 
2000US-0234082P. 



Db 



274 CC AGAAGAT T CT GAGC CAAT CAGT AT T T C G CAT GGCAACT ATACAAAACAGT AT C C GGT G 333 



Qy 121 T T T GTG GGC C ACAAGC C AG GAC G GAAC AC CAC AC AGAGGC ACAGGCT G GAC AT CCAGAT G 18 0 

I I I I I II I II I I I I II I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I II I I I I 
Db 334 TTT GTGGGCCACAAGCCAGGAC GGAACACCACACAGAGGCACAGGCT GGACAT CCAGAT G 393 

Qy 181 AT TAT GAT CAT GAAC G GAAC C CT CT AC AT T GCT G CT AGGGAC CAT AT T TAT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 394 AT TAT GAT CAT GAACGGAAC C CT CT AC AT T GCT GCT AGGGAC CAT AT T TAT ACT GT T GAT 453 

Qy 241 AT AGACAC AT CACACAC GGAAGAAATT T AT T GT AG CAAAAAACT GACAT G GAAAT CT AGA 300 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 454 AT AGAC ACAT CAC ACACGGAAGAAAT T TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 513 

Qy 301 CAGGC C GAT GTAGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACT T T 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 514 CAGGC C GAT GTAGACACAT GCAGAAT GAAGGGAAAACAT AAG GAT GAGT GC CACAACT T T 57 3 

Qy 361 AT TAAAGTT C TT CT AAAGAAAAAC GAT GAT GC AT T GT TT GT CT GT GGAACTAAT GC CT T C 42 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 574 AT TAAAGTT CTT CTAAAGAAAAAC GAT GAT GC AT T GT TT GT CT GTG GAACT AAT GC CT T C 633 

Qy 421 AACCCTT CCT GCAGAAACTATAAGAT GGATACATT GGAACCATT CGGGGAT GAATT CAGC 48 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I 
Db 634 AACCCTT C CT GCAGAAACTATAAGAT GGATACATT GGAACCATT CGGGGAT GAATT CAGC 693 

Qy 481 G GAAT GG C CAGAT GC C CAT AT GAT GC CAAACAT GC CAACGTT GCACT GT T T GCAGAT GGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 694 GGAAT GGC CAGAT GC C CAT AT GAT GC CAAACAT GC CAAC GTT GCACT GT T T GCAGAT GGA 753 

Qy 541 AAACT ATACT CAGCCACAGT GACTGACTT CCTT GCCATT GACGCAGT CATTTACCGGAGT 600 

I I I I I I I I I I I II I I I I I I II I I M I I I I II I I I I I II I M I I I I I I I I I I I I I I I I I I I 
Db 754 AAACT ATACT CAGCCACAGT GACT GACT T CCTT GC CATT GAC GCAGT CAT T T AC CGGAGT 813 

Qy 601 CT T G GAGAAAGC C CT ACC CT GC G GAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC C A 660 

I M | II I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 C T T GGAGAAAGC C CT ACC CT GC GGAC C GT CAAGCAC GAT T CAAAAT GGT T GAAAGAAC C A 873 

Qy 661 T ACTTT GTT CAAGCC GTGGATT ACGGAGATTATAT CTACTTCTT CTT CAG GGAAAT AGCA 72 0 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 874 T ACT T T GT T CAAGCC GT G GATT ACGGAGAT TAT AT CT ACT T CT T CTT CAG GGAAAT AGCA 933 

Qy 721 GTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAAT 78 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 934 GT GGAGTATAACACCATGGGAAAGGTAGTTTT C CCAAGAGTGGCT CAGGTTT GTAAGAAT 993 

Qy 781 GAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT CGT T C C T GAAGGC GCGC 84 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 GAT AT G GGAGGAT CT CAAAGAGT CCT GGAGAAACAGTGGAC GT CGT T C CT GAAGG C GCG C 1053 

Qy , 841 T T GAACT G CT CAGT T C CT GGAGACT CT CAT TT T TAT TT CAAC ATT CT C CAGGCAGT T AC A 900 

I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 T T GAACT GCT CAGT T C CT GGAGACT CT CAT TTT T ATTT CAACATT CTC CAGG CAGT TAC A 1113 

Qy 901 GAT GT GAT T C GT AT CAAC GGG C GT GAT GT T GT C CT GGCAAC GT TT T CT ACAC CTT AT AAC 960 

I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1114 GATGT GAT T C GT AT CAAC GGGC GT GAT GT T GT C CT GGCAAC GT TT T CT ACAC CTTAT AAC 1173 



Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I > I I M I M I I 
Db 1174 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1233 

Qy 1021 GGGAGAT T CAAGGAACAGAAGT CT C CT GATTC CAC CT GGACAC CAGT T C CT GAT GAACGA 1080 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1234 GG GAGAT T CAAGGAACAGAAGT CT C CT GAT T C C AC CT G GACAC CAGT T C CT GAT GAACGA 12 93 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1294 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1353 

Qy 1141 TCCAAT GAGTTCCCTGAT GATACCCT GAACTT CAT CAAGACGCACCCGCT CAT GGAT GAG 1200 

I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1354 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACTT CAT CAAGACGCACC C GCT CAT G GAT GAG 1413 

Qy 1201 GC AGT GCC CT C CAT CT T CAACAG GC CAT GGTT C CT GAGAACAATGGT CAGAT AC C G C CT T 1260 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1414 GC AGT GC C CT C C ATCT T CAACAGGC C AT GGTT C CT GAGAACAAT GGT CAGAT AC C GC CTT 1473 

Qy 1261 AC CAAAATT G C AGT G GACACAGCT GCT GGGCC AT AT CAGAAT CAC ACT GT GGT T T T T CT G 1320 

I I I I I M I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1474 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1533 

Qy 1321 GGAT C AGAGAAGGGAAT CAT CTT GAAGT TT TT GGC C AGAATAGGAAAT AGT GGT T T T CT A 1380 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M 
Db 1534 G GAT C AGAGAAG GGAAT CAT CT T GAAGTT T TT GGC CAGAAT AG GAAAT AGT GGTT T T CT A 1593 

Qy 1381 AAT GACAGC CT T T T C CT GGAGGAGAT GAGT GTT TACAACT CT GAAAAAT GCAG CT AT GAT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 1594 AAT GACAGC CT T TT C CT GGAG GAGAT GAGT GT T TACAACT CT GAAAAAT GCAGCT AT GAT 1653 

Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAG CT GGACAGAGCAAGC AGCT CT CT GT AT 1500 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1654 GGAGT CGAAGACAAAAGGATCAT GGGCATGCAGCT GGACAGAGCAAGCAGCT CTCT GT AT 1713 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1714 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1773 

Qy 1561 T GT AAAAAAAC CT GT AT T GCCT CC AGAGACC C AT AT T GT GGAT G GAT AAAGGAAGGT G GT 1620 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1774 T GTAAAAAAACCTGTAT T GCCTCCAGAGACCCAT ATTGT GGAT GGATAAAGGAAGGTGGT 1833 

Qy 1621 GC CT G CAGC C AT TT AT CAC C CAAC AGCAGACT GACT TT T GAGCAGGAC ATAGAGC GT GGC 1680 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 18 34 GC CT GC AGC C AT TT AT CAC C CAAC AGCAGACT GACT TTT GAGCAGGAC AT AGAGC GT GG C 1893 

Qy 1681 AATACAGATGGT CT GGGGGACT GT CACAATT CCTTTGT GGC ACT GAAT GGGCAT T C CAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I i I II I I I II I I I I I I I I I M I 
Db 18 94 AAT ACAGAT GGT CT G GG G GACT GT CACAATT C CT TT GT GG CACT GAAT GGGCAT T C CAGT 1953 

Qy 1741 TCCCTCTTGCC CAGCACAAC CAC AT CAGAT T C GAC GGCT CAAGAG GGGT AT GAGT C T AGG 1800 

I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I 
Db 1954 T C C CT CT T GC C CAG C ACAAC CACAT CAGAT T C GAC GGCT C AAGAGGGGT AT GAGT CT AGG 2013 



Qy 1801 GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 18 60 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 014 GGAGGAAT GCT GGACT GGAAGCAT CT GCTT GACT CAC CT GACAGCACAGACCCTTT GGGG 2 073 

Qy 1861 GCAGT GT CT T C C C AT AAT CACCAAGACAAGAAGGGAGT GATT C GGGAAAGTT AC CT CAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 
Db 2 07 4 GCAGTGTCTTCCCATT^TCACCAAGACAAGAAGGGAGTGATTCGGGAAAGTTACCTCAAA 2133 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2134 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2193 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2194 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2253 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2254 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2313 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I I I M M M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2314 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2373 

Qy 2161 G C CAT C CT CACGC C ACTCAT GC ACAACGG CAAGCT C GC CACT C C C GGCAACAC GGC CAAG 2220 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2374 G C CAT C CT CAC G C CACT CAT GC ACAACG G CAAG CT C GC CACT C CC GGCAACAC GGC CAAG 2433 

Qy 2221 AT GCT CAT T AAAGCAGAC CAGC AC CAC CT GGAC CT GAC GGC C CT C C CC AC CC CAGAGT C A 22 80 

I I I I I II I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2434 AT GCT CAT TAAAGCAGAC CAGC AC C ACCT GGAC CT GAC GGC C CT C C CC AC CC CAGAGT C A 24 93 

Qy 2281 AC CC CAAC GCT GCAGCAGAAGC GGAAGC C CAGC CGC GGC AGC C GC GAGT GGGAGAGGAAC 2340 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2494 AC CC CAAC GCT G CAGCAGAAG C GGGAAC C CAGC CGC GG CAC C C GC GAGT GGGAGAG GAAC 2553 

Qy 2341 C AGAAC CT CAT CAAT GC CT GCACAAAGGACAT GCC C C C CAT GGGCT CC C CT GT GAT T C C C 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2554 CAGAACCTCATCAATGCCT GCACAAAGGACAT GCCCCCCATGGGCTCCCCTGT GATT CCC 2613 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 
Db 2614 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2673 

Qy 2461 AC GCAGC AG GGCTAC CAGCAT GAGT ACGT GGAC CAG C C CAAAAT GAGC GAGGT GGC C C AG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 
Db 2674 AC GCAG C AGGGCT AC CAG CAT GAGT ACGT GGAC CAG CC CAAAAT GAGC GAGGT GGC C CAG 27 33 

Qy 2521 AT GGC GC T G GAGGAC CAGGCC GCCACACT GGAGTAT AAGAC CAT CAAGGAACAT CT CAGC 2580 

I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I 
Db 2734 AT GGCGCT GGAGGACCAGGCCGCCACACT GGAGTAT AAGAC CAT CAAGGAACATCT CAGC 2793 

Qy 2581 AGCAAGAGT C C CAAC CAT GGGGTGAAC CT T GT GGAGAAC CT G GAC AGC CT GC C CCC CAAA 2640 

I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2794 AGCAAGAGT C C CAAC CAT G GGGT GAAC CT T GT GGAGAAC CT GGAC AG CCTGCCCCC CAAA 2853 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 



Db 2854 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2913 

Qy 2701 AGCAAGCGGCT GGAAATG CACC ACT C CT CT T C CT AC GG G GT T GACTATAAGAG GAGCT AC 2760 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2914 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2 973 

Qy 2761 C C CAC GAACT C GCT CAC GAGAAGC CACC AG GC CACC - AC T CT CAAAAGAAACAAC ACT AA 2819 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 
Db 2974 C C CAC GAACT C GC T CAC GAGAAGC CACCT GAC CAC CT AC T CT CAT CAGAAG CAAC ACT AA 3033 

Qy 2 82 0 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 2 878 

III I I I II I III II II I I II I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 3034 C C C C GACAATT CAN CT CT GACT T C AAAGGGAC CAGAGCT T T GGCAGGG GAGACAAC CC GC 3093 

Qy 2 87 9 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2 938 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3094 C G C C C GCC C CG C AGAGGGT GGACT C CAT C CAG GT G CACAGCT CCC AGC CAT C T GGC CAGG 3153 

Qy 2939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 3154 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3213 

Qy 2999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 
Db 3214 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3273 

Qy 3059 C CAC AT C CAT GAAGC C CAAT GAT G C GT GT AC ATAA 3093 

I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I 
Db 3274 C C ACAT C CAT GAAGC C CAAT GAT G C GT GT AC AT AA 3308 



RESULT 4 
ABX71103 

ID ABX71103 standard; cDNA; 4280 BP. 
XX 

AC ABX71103; 
XX 

DT 05-MAR-2003 (first entry) 
XX 

DE Novel human cDNA sequence #328. 
XX 

KW Human; gene; ss; nervous system disorder; peripheral neuropathy; 

KW Huntington's disease; amyotrophic lateral sclerosis; haemophilia; 

KW neurodegenerative disease; Parkinson's disease; Alzheimer's disease; 

KW autoimmune disease; systemic lupus erythematosus; rheumatoid arthritis; 

KW insulin-dependent diabetes mellitus; anaemia; thrombocytopaenia; wound; 

KW ulcer; burn; bone disorder; osteoporosis; osteoarthritis; stroke; 

KW fibrosis; reperfusion injury; infection; allergic rhinitis; asthma; 

KW coagulation disorder; cancer; tumour; inflammatory disease; septic shock; 

KW Crohn's disease; anaphylaxis; proliferation; chemotactic; 

KW differentiation; stem cell growth factor; haematopoiesis ; chemokinetic; 

KW haemostatic; antiinflammatory; expressed sequence tag; EST. 

XX 

OS Homo sapiens. 
XX 

PN WO200281731-A2. 



PD 17-OCT-2002. 
XX 

PF 29-JAN-2002; 2002WO-US001222 . 
XX 

PR 30-JAN-2001; 2 001US-00774528 . 
XX 

PA (HYSE-) HYSEQ INC. 

PA (GOOD/) GOODRICH R W. 
XX 

PI Tang TY, Liu C, Zhou P, Asundi V, Zhang J, Zhao QA, Ren F; 

PI Xue AJ, Yang Y, Wehrman T, Wang J, Wang D, Drmanac RT; 

XX 

DR WPI; 2003-058563/05. 
XX 

PT Novel polypeptide useful for treating neurodegenerative diseases, myeloid 

PT or lymphoid cell disorders, bone disorders, mechanical and traumatic 

PT disorders, coagulation disorders, and inflammatory diseases. 
XX 

PS Claim 1; Page; 612pp; English. 
XX 

CC This invention relates to the cDNA sequences encoding an isolated novel 

CC human polypeptide. The protein encoded by the nucleic acid of the 

CC invention is useful for treating central and peripheral nervous system 

CC diseases (e.g. peripheral neuropathy, Huntington's disease, amyotrophic 

CC lateral sclerosis); neurodegenerative diseases (e.g. Parkinson's disease, 

CC Alzheimer's disease); autoimmune disease (e.g. systemic lupus 

CC erythematosus, rheumatoid arthritis, insulin-dependent diabetes mellitus) 

CC ; myeloid or lymphoid cell disorders (e.g. anaemia and thrombocytopaenia) 

CC ; wounds, ulcers, burns; bone disorders (e.g. osteoporosis, 

CC osteoarthritis); mechanical and traumatic disorders (e.g. stroke, head 

CC trauma); lung or liver fibrosis; reperfusion injury in various tissues; 

CC bacterial, viral or fungal infections; allergic conditions such as 

CC allergic rhinitis, asthma; coagulation disorders (e.g. haemophilia); 

CC cancer and tumours; and inflammatory diseases (e.g. septic shock, Crohn's 

CC disease, anaphylaxis) . The protein may be used to inhibit the growth, 

CC infection or function of infectious agents such as bacteria, fungi, 

CC viruses, or to effect bodily characteristics, biorhythms or circadian 

CC cycles of rhythms . The protein may also have 

CC prolif eration/dif f erentiation, stem cell growth factor, haematopoiesis 

CC regulation, immune stimulating or suppressing, chemotactic/chemokinetic, 

CC haemostatic and thrombolytic, receptor/ligand, and antiinflammatory 

CC activities. The cDNA sequences of the invention are useful for expressing 

CC recombinant protein for analysis. The present sequence represents a novel 

CC human cDNA sequence of the invention, this sequence is an expressed 

CC sequence tag (EST) and was identified using subtractive hybridisation 
XX 

SQ Sequence 4280 BP; 1185 A; 1165 C; 1001 G; 929 T; 0 U; 0 Other; 

Query Match 98.0%; Score 3032; DB 7; Length 4280; 
Best Local Similarity 98.4%; Pred. No. 0; 

Matches 3093; Conservative 0; Mismatches 0; Indels 51; Gaps 1 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 267 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 326 



Qy 61 C C AGAAGAT T C T GAG C CAAT C AGT AT T T C G CAT G G C AACT AT AC AAAAC AGT AT C C G GT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 327 C CAGAAGATT CTGAGCCAAT CAGTATTT CGCAT GGCAACT ATACAAAACAGTAT CCGGTG 386 

Qy 121 T TT GT GGGC CACAAGC C AGGAC G GAAC ACCACAC AGAGGCACAGGCT GGAC AT C CAG AT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 387 TTTGTGGGC C ACAAGC CAGGAC GGAAC ACCACAC AGAGGC AC AG GCT G GAC AT C CAGAT G 4 46 

Qy 181 ATT ATGATCAT GAACGGAACCCT CTACATT GCT GCTAGGGACCATATTTAT ACT GTT GAT 240 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 47 ATT ATGATCAT GAACGGAACCCT CTACATT GCT GCTAGGGACCATATTTAT ACT GTT GAT 506 

Qy 241 ATAGACACAT CACACACGGAAGAAATTT AT TGTAGCAAAAAACT GACAT GGAAATCTAGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 507 ATAGACACAT CACACACGGAAGAAATTT ATTGTAGCAAAAAACT GACAT GGAAAT CTAGA 566 

Qy 301 CAG GC C GAT GT AGACAC ATGC AGAAT GAAGGGAAAAC AT AAGGAT GAGT GC CACAACT T T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 567 CAG GC C GAT GTAGACACATGC AGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACT T T 626 

Qy 361 ATTAAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACTAAT GCCT T C 420 

I I I I I I II I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 627 ATTAAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT TGTTTGTCTGT GGAACTAAT G CCTT C 686 

Qy 421 AAC C CT T C CT GCAGAAACT AT AAGAT G GAT ACAT T GGAAC CATT C GG G GAT GAAT T CAGC 4 80 

I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 687 AAC C CT T C CT GCAGAAACT AT AAGAT G GAT ACAT T GGAAC CATT C GGGGAT GAAT T CAGC 746 

Qy 481 GGAAT GGC CAGAT GC C CAT AT GAT GCCAAACAT GC CAACGT T G CACT GT TT GCAGAT GGA 540 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 GGAAT GGC CAGAT G C C CAT AT GAT GCCAAACAT GC CAACGT T G CACT GTTT GCAGAT GGA 806 

Qy 541 AAACTAT ACT CAG C CAC AGT GACT GACT T C CT T GC CAT TGAC G CAGT C ATT TAC C GGAGT 600 

I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 807 AAACTAT ACT CAGC CACAGT GACT GACT T C CT T GC CAT TGAC G CAGT CATT TAC C GGAGT 866 

Qy 601 CTT G GAGAAAGCC CT AC C CT GC G GACC GT C AAG C ACGATT CAAAAT GGTT GAAAGAAC CA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 867 CTT GGAGAAAGCC CTAC C CT GC G GACC GT CAAG C ACGATT CAAAAT GGT T GAAAGAAC CA 926 

Qy 661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 927 TACT T T GT T CAAGC C GT GGAT T AC GGAGAT TAT AT CT ACT T CTT CTT CAG GGAAAT AGCA 986 

Qy 721 GT GGAGTAT AACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT G G CT CAGGTT T GT AAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 987 GT GGAGTAT AACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT G GCT CAGGTT T GT AAGAAT 1046 

Qy 7 81 GAT AT G G GAG GAT CT CAAAGAGT C CT G GAGAAAC AGT GGAC GT C GTT C CT GAAGGC GC G C 840 

II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1047 GAT AT GGGAGGAT CT CAAAGAGT C CT G GAGAAAC AGT GGAC GT C GTT C CT GAAGGC GC G C 1106 

Qy 841 T T GAACT G CT CAGT T C CT GGAGACT CT C AT TT TT ATT T CAACAT T CT C CAGGCAGT T ACA 900 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1107 T T GAACT G CT CAGT T C CT GGAGACT CT CAT TT TT ATT T CAACAT T CT C CAGGCAGT T ACA 1166 

Qy 901 GAT GTGAT T C GT AT CAAC GGGC GT GAT GTT GT C C T GGCAAC GTT TT CTAC AC CT TAT AAC 960 



1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1167 GAT GT GATT C GTAT CAAC GGG C GT GAT GT T GT CC T GGCAAC GTT T TCT ACAC CT T AT AAC 1226 

Qy 961 AGC AT C C C T G G GT CT GCAGT CT GT GCCT AT GACAT GCTT GACAT T GC C AGT GTT T TT ACT 1020 

I I I I I I I I II I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1227 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1286 

Qy 1021 GGGAGAT T C AAGGAACAGAAGT CT C CT GAT T C CAC CT G GACAC C AGT T C CT GAT GAAC GA 1080 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 12 87 GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTTCCT GAT GAACGA 134 6 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1347 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1406 

Qy 1141 T CCAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC G CAC CC GC TCAT GGAT GAG 1200 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 07 T CCAAT GAGTT C CCT GAT GAT AC C CT GAACT T CAT CAAGAC GC AC CC GCT CAT GGAT GAG 1466 

Qy 1201 G CAGT GC C CT C CAT CTT CAAC AGGC CAT GGT T C CT GAGAACAAT GGT CAGATAC C GC CTT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1467 GCAGT GC C CT C CAT CTT CAACAGGC CAT GGT T C CT GAGAACAAT G GT CAGATAC C GC CTT 152 6 

Qy 1261 ACCAAAAT T GCAGT G GACACAG CT GCT GGGC CAT ATC AGAAT C ACACT GT GGTT T T T CT G 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1527 ACCAAAAT T GCAGT G GACACAGC T GCT GGGC CAT AT C AGAAT C ACACT GT GGTTT T T C T G 158 6 

Qy 1321 GGAT CAGAGAAGGGAAT CAT CTT GAAGT T T T T GGC CAGAATAGGAAAT AGT GGTT T T CT A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1587 GGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T G GC CAGAAT AG GAAAT AGT GGT T T T CT A 164 6 

Qy 1381 AAT GACAGCCTTTT C CT GGAGGAGATGAGT GTTTACAACT CT GAAAAATGCAGCTAT GAT 144 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1647 AAT GACAGCCT TT T CCT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GC AGCT AT GAT 1706 

Qy 1441 GGAGTC GAAGACAAAAGGAT CAT GGG CAT GCAGCT G GACAGAGCAAGCAGCT CT CT GT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 1707 GGAGT C G7VAGACAAAAG GAT CAT GGGC AT GCAG CT GGACAGAG CAAG CAG CT CT C T GTAT 17 66 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1767 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1826 

Qy 1561 T GT AAAAAAAC CT GTAT T GC C T C CAGAGAC C CAT AT T GT G GAT GGAT AAAGGAAGGT GGT 1620 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1827 T GT AAAAAAAC CT GTAT T GC CTC CAGAGAC C CAT AT T GT GGAT GGAT AAAGGAAGGT GGT 188 6 

Qy 1621 GCCT GC AGC C ATT TAT CAC C CAACAG CAGACT GAC T T T T GAGC AGGACAT AGAGC GT GGC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I II I I I I I I I II I I I I I I I I M I I I I 
Db 1887 GCCT GCAGC CATTTATCACCCAACAGCAGACTGACTTTT GAGCAGGACATAGAGCGT GGC 1946 

Qy 1681 AAT ACAGAT GGT CT GG GGGACTGT CAC AAT T CCT T T GT GGCAC T GA 172 6 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1947 AAT ACAGAT GGT CT GGGGGACT GT CAC AAT T CCT TT GT G GCACT GAAT GACAT TT CAACT 2006 

Qy 1727 ATGGGCATTCCAGTTCCCTCTTG 174 9 

I I I I I I I I I I I I I I I I I I I I I I I 



2 007 CCTCTACCAGATAATGAAATGTCTTACAACACAGTGTATGGGCATTCCAGTTCCCTCTTG 2066 



1750 CCCAGCACAACCACATCAGATT CGAC GGCTCAAGAGGGGTAT GAGT CTAGGGGAGGAAT G 1809 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2067 CCCAGCACAACCACATCAGATT CGACGGCTCAAGAGGGGTAT GAGT CTAGGGGAGGAAT G 2126 

1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 18 69 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2127 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 2186 

1870 T C C CAT ANT CAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT T AC CT CAAAGGCC AC GAC 1929 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
2187 T C C CAT AAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT T AC CT CAAAGG CCAC GAC 2246 

1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I I I I II I I I I M I I I I I I I I I I I M I I I I M I I I I II I I I II I I I I I I I I I I I I I I I I I I 

2247 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 2306 

1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2 049 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2307 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2366 

2050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I M M I I I II I I I II I II I I I I I I I 

2367 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2426 

2110 AAG CT C AGC GG C C T CTTT GGGGACACT CAAT CCAAAGAC C CAAAG C C GGAG GC CAT C CT C 2169 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I I I 
2427 AAGC T C AGC GG C CT CTT T GG GGAC ACT CAAT CCAAAGAC C CAAAGC C GGAGG C CAT C CT C 2 4 86 

2170 AC G CCACT CAT GC ACAAC G GCAAGC T C GC C ACT C C C GGCAACAC GG C CAAGAT GCT CAT T 2229 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

24 87 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2546 

2230 AAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 2289 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I II I I I I M I I II I I I I I I I I I I I I I I I II 
2547 AAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 2606 

22 90 CT GCAGCAGAAGC G GAAGC C C AGC C GC GGCAGC C GC GAGT GGGAGAG GAAC CAGAAC CT C 2349 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2607 CT GCAGCAGAAGC GGAAGCCCAGCCGC GGCAGC CGC GAGT GGGAGAGGAAC CAGAAC CTC 2666 

2350 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 2 4 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I II I I I II I I 

2667 AT CAAT GC CTGC ACAAAGGAC AT GC C C C C CAT GGGCTCCCCTGT GAT T C C C ACGGAC CT G 2726 

2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
2727 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 27 86 

2470 GG CT AC C AGC AT GAGT AC GT GGAC CAGC C CAAAAT GAG C G AGGT GGCC CAGAT GGC G CT G 2529 

I I M II I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
2787 G GCT AC C AGCAT GAGTAC GT GGAC CAG C C CAAAAT GAGC GAGGT G GCC CAGAT GGC GCT G 2 846 

2530 GAGGAC C AGGC C GC CACACT GGAGT AT AAGAC CAT CAAG GAACAT CT CAG CAGC AAGAGT 2589 

I || I I I I I I I || I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
2 847 GAGGACC AGGCC GCCACACT GGAGTAT AAGAC CAT CAAGGAACAT CTCAGCAGCAAGAGT 2 906 



Qy 2590 C CCAAC CAT GG GGT GAAC CT T GT G GAGAAC CT G GACAGCC T GC C C C C CAAAGTT C CAC AG 2 64 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2907 C CCAAC CAT GGGGT GAAC CT T GT G GAGAAC CT G GACAGCC T GC C C CC CAAAGTT C CAC AG 2966 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 29 67 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3026 

Qy 2710 CTGGAAAT GCACCACT C CT CT T C CT AC GGGGT T GACT ATAAGAGGAGC T AC C CC ACGAAC 2769 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 3027 CT GGAAAT GC ACCACT C CT CT T C CT AC G GGGTT GACT ATAAGAGGAGCT AC C CC ACGAAC 308 6 

Qy 2770 TCGCTCAC GAGAAGCCACCAGGC CACCACT CTCAAAAGAAACAACACTAACT CCT CCAAT 2829 

I I M I I I M I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II II I I I I I I I I I I I II 
Db 3087 T CGCTCAC GAGAAGCCACCAGGC CACCACT CTCAAAAGAAACAACACTAACTCCT CCAAT 314 6 

Qy 2830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCGCCG 2889 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 3147 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3206 

Qy 2 8 90 CAGAGG GT GGACT C CAT C CAGGT GCAC AGCT CC CAGC CAT CT G GC CAGGC C GT GACT GT C 2 94 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I J I I I I I II 

Db 3207 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 3266 

Qy 2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I M I I II M I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 3267 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 332 6 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCA7\ACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 3327 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3386 

Qy 3070 AAGC C CAAT GAT GC GT GT ACAT AA 3093 

I II I M I I II I I I I I I I I I I I I I I 
Db 3387 AAGC C CAAT GAT G C GT GT AC AT AA 3410 



RESULT 5 
ADA23361 

ID ADA23361 standard; cDNA; 4250 BP. 
XX 

AC ADA23361; 
XX 

DT 20-NOV-2003 (first entry) 
XX 

DE cDNA encoding human SECX polypeptide, SEC15. 
XX 

KW Human; secreted polypeptide; membrane-associated polypeptide; SECX; SECl; 

KW SEC2; SEC3; SEC4; SEC5; SEC6; SEC7; SEC8; SEC9; SEC10; SECll; SEC12; 

KW SEC13; SEC14; SEC15; SECX-associated disorder; lung cancer; 

KW cardiovascular disease; oncology disease; immune disorder; 

KW autoimmune disease; transplant rejection; allergy; AIDS; infections; 

PCW inflammatory disorder; arthritis; haematopoietic disorder; skin disorder; 

KW atherosclerosis; restenosis; neurological disease; Alzheimer's disease; 

KW trauma; wounds; spinal cord injury; skeletal disorder; cytostatic; 

KW antiinflammatory; immunosuppressive; anti-HIV; antiarthritic; 



KW antiarteriosclerotic; cardiant; neuroprotective; nootropic; vulnerary; 

KW antiallergic; cardiant; dermatological ; gene; ss. 
XX 

OS Homo sapiens. 
XX 

PN US2003054514-A1. 
XX 

PD 20-MAR-2003. 
XX 

PF 19-SEP-2001; 2001US-00957187 . 
XX 

PR 09-MAR-1999; 

PR 04-JAN-2000; 

PR 08-MAR-2000; 

PR 19-SEP-2000; 

PR 20-SEP-2000; 
XX 

PA (SHIM/) SHIMKETS R A. 

PA (LARO/) LAROCHELLE W J. 
XX 

PI Shimkets RA, Larochelle WJ; 
XX 

DR WPI; 2003-540616/51. 

DR P-PSDB; ADA23362. 
XX 

PT New SECX nucleic acids , useful for treating or diagnosing a disorder 

PT e.g., lung cancer, cardiovascular and oncology diseases, immune disorder, 

PT and autoimmune disease. 

XX 

PS Claim 3; Page 13-14; 118pp; English. 
XX 

CC The present invention relates to the isolation of human secreted or 

CC membrane-associated (SECX) polypeptides designated SEC1-SEC15, and the 

CC polynucleotide sequences encoding them. Also disclosed is a method for 

CC screening for a modulator of activity or latency of SECX. The SECX 

CC polypeptide and polynucleotide sequences may be used for treating or 

CC preventing SECX-associated disorders such as lung cancer, cardiovascular 

CC and oncology diseases, immune disorders, autoimmune diseases, transplant 

CC rejection, allergy, AIDS, infections, inflammatory disorders, arthritis, 

CC haematopoietic disorders, skin disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g. Alzheimer's disease), trauma, wounds, spinal 

CC cord injuries, and skeletal disorders. The present sequence encodes a 

CC SECX polypeptide of the invention. 
XX 

SQ Sequence 4250 BP; 1168 A; 1161 C; 995 G; 926 T; 0 U; 0 Other; 

Query Match 97.8%; Score 3025.6; DB 8; Length 4250; 
Best Local Similarity 98.3%; Pred. No. 0; 

Matches 3089; Conservative 0; Mismatches 4; Indels 51; Gaps 1; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 

Qy 61 CC AGAAGATT C T GAGC C AAT CAGT AT T T C GCAT G GCAACT AT AC AAAACAGT AT C CGGT G 120 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 310 CC AGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT T GCAACT AT AC AAAACAGT AT C C GGT G 369 



99US-0123667P. 
2000US-0174485P. 
2000US-00520781. 
2000US-0233798P. 
2000US-0234082P. 



Qy 121 TTTGT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACATCCAGATG 18 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I ! I I I I 
Db 370 TTTGT GGG CC AC AAGC CAGGAC GGAAC ACCACAC AGAGGC ACAGGCT GGAC AT C C AGAT G 429 

Qy 181 AT TAT GAT CAT GAAC G GAAC C CT CT AC AT T GCT GCT AGGGAC CAT AT T TAT ACT GT T GAT 24 0 

I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 ATT AT GAT CAT GAAC GGAAC CC T CT AC AT T G CT GC T AGGGAC CAT AT TT AT ACT GT T GAT 489 

Qy 241 AT AGACACAT CAC ACAC G GAAGAAATT T AT T GTAGCAAAAAAC T GAC AT GGAAAT CT AGA 300 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 90 ATAGACACATCACACACGGAAG7W^TTTATTGTAGCAAAAAACTGACATGGAAATCTAGA 549 

Qy 301 CAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAAC AT AAGGAT GAGT GC CACAACT T T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I II I II I I I I I II I I I I I I I I I I I I I I I I 
Db 550 CAGG CC GAT GT AGACACAT GCAGAAT GAAGGGAAAAC AT AAGGAT GAGT G C CACAACT TT 609 

Qy 361 ATTAAAGT TCT T CTAAAGAAAAAC GAT GAT G CAT T GT T TGT CT GT GGAACT AAT GCCT T C 420 

I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 610 ATTAAAGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 669 

Qy 421 AAC C CT T C CT GCAGAAACT AT AAGAT G GAT ACAT T G GAAC CATT C GG G GAT GAAT T CAGC 48 0 

I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 670 AAC C CTT C CT G CAGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T CGGGGAT GAAT T CAGC 729 

Qy 4 81 GGAATGGCCAGAT GCC CATAT GAT GCCAAACAT GCCAACGTTGCACTGTTTGCAGATGGA 540 

I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 730 GGAATGGCCAGAT GCCCAT AT GAT GCCAAACAT GCCAAC GTTGCACT GTTT GCAGAT GGA 78 9 

Qy 541 AAACTATACT CAGCCACAGT GACTGACT T CCTT GCCATT GACGCAGT CATTTACCGGAGT 600 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II I I 
Db 790 AAACTATACT CAGCCACAGT GACT GACTT CCTT GCCATT GAC GCAGT CATTTACC GGAGT 849 

Qy 601 CT T G GAGAAAGC C CT AC CCT GC GGAC C GT CAAGC AC GAT T CAAAAT GGTT GAAAGAAC C A 660 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 850 CT T GGAGAAAGC C CT AC CCT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC CA 909 

Qy 661 T ACT T T GTT CAAGC C GT GGAT T AC GGAGAT T AT AT CT ACT T CT T CT T CAGGGAAAT AGCA 72 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 910 T AC T T T GTT CAAGC C GT GGAT T AC GGAGAT T AT AT CTACT T CT T CTT CAGGGAAAT AG C A 969 

Qy 721 GT GGAGT AT AAC AC CAT G G GAAAGGT AGT T T T C C C AAGAGT G GCTC AGGT T T GT AAGAAT 78 0 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 970 GT G GAGTATAACACC AT GGGAAAGGT AGT T T T C C C AAGAGT GGCT C AGGT T T GT AAGAAT 1029 

Qy 781 GATAT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGACGT CGTT CCT GAAGGC GCGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1030 GATAT GGGAGGAT CT CAAAGAGTCCT GGAGAAACAGT GGACGT CGTTCCT GAAGGCGCGC 1089 

Qy 841' TT GAACT GCT CAGTT C CT GGAGACT CT C AT TT T TAT T T CAACAT T CT CCAGGC AGT T AC A 900 

I I I I I I I I I I I I II II I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1090 T T GAACT G CT C AGTT C CT GGAGACT CT C AT TTT T AT T T CAAC ATT CT CCAGGC AGT TACA 114 9 



Qy 

Db 



901 
1150 



960 
1209 



Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 1210 AG CAT CCCTGGGTCTG CAGT CT GT GC C TAT GAC AT GCT T GACAT T G C CAGT GT T T TT ACT 1269 

Qy 1021 GGGAGATTCAAGGAACAGAAGTCT CCT GATT CCACCT GGACAC CAGTT CCT GAT GAACGA 108 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1270 GGGAGATTCAAGGAACAGAAGTCTCCT GATT CCACCT GGACAC CAGTT CCT GAT GAACGA 132 9 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1330 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 138 9 

Qy 1141 TCCAAT GAGTT CCCTGATGATAC CCT GAACT TCATCAAGACGCACC CGCT CAT GGAT GAG 1200 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I II I I I I I I I M I I I I I I I 

Db 1390 T C C AAT G AGT T C C C T GAT GAT AC CCT G AAC T T CAT C AAG AC G C AC C C G C T CAT G GAT GAG 1449 

Qy 12 01 GC AGT G C CCT C CAT CT T CAACAGG C CAT G GT T C CT GAGAACAAT GGT CAGAT AC C GC CTT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1450 GCAGTGCCCT CCAT CTT CAACAGGCCATGGTTCCTGAGAACAAT GGTCAGATAC CGC CTT 1509 

Qy 1261 AC CAAAATT G CAGT GGACAC AGCT GCT GGGC C ATAT CAGAAT C ACACT GTGGTTTTTCTG 132 0 

I M I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I M I 

Db 1510 AC CAAAATT GCAGT GGACAC AG CT G CT GG GC CAT AT CAGAAT C ACACT GTGGTTTTTCTG 1569 

Qy 1321 GGATCAGAGAAGGGAAT CAT CTT GAAGTTTTT GGCCAGAATAGGAAATAGT GGTTTT CTA 1380 

II | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I 

Db 1570 GGATCAGAGAAGGGAAT CAT CT T GAAGTTTTTGGCCAGAATAGGAAATAGT GGTTTT CTA 1629 

Qy 1381 AAT GAC AGC CTT T T C CT G GAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GCAG CT AT GAT 144 0 

I | I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1630 AAT GAC AGC CTT T T C CT GGAGGAGAT GAGT GT TT ACAACT CT GAAAAAT G CAGCT AT GAT 1689 

Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GTAT 1500 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1690 G GAGT C GAAGACAAAAGGAT CAT GG G CAT GCAGCT GGACAGAG CAAGCAGC T CT CT GTAT 174 9 

Qy 1501 GTTGCGTTCTCTACCTGTGT GAT AAAGGTTCCCCTTGGCCGGTGTGAAC GACAT GGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1750 GTTGCGTTCTCTACCTGTGT GAT AAAGGTTCCCCTTGGCCGGTGTGAAC GACAT GGGAAG 1809 

Qy 1561 T GT AAAAAAAC CT GTAT T GC CT C CAGAGAC CCAT AT T GT GGAT GGAT AAAGGAAGGT GGT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 1810 T GTAAAAAAACCT GT ATT GCCT CCAGAGACCCATATT GT GGAT GGAT AAAGGAAGGT GGT 1869 

Qy 1621 GC CT G C AGC CAT T TAT CAC C CAACAGCAGACT GACT T T T GAGC AGGACAT AGAGC GT GGC 1680 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1870 G C CT GCAGC CAT T TAT CACC CAACAG CAGACT GACTT T T GAGCAGGACAT AGAGC GT GG C 1929 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGA 1726 

I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1930 AAT AC AGAT GGT CT G GGG GACT GT C ACAATT C CTTT GT GGCACT GAAT GACAT T T CAACT 1989 

Qy 1727 ATGGGCATTCCAGTTCCCTCTTG 1749 

I I I I I I I I II I I I II I I I I I I I I 

Db 1990 C CTCT AC CAGAT AAT GAAATGT CTTACAACACAGT GTAT GGGCATT CCAGTT CCCT CTT G 2 049 

Qy 1750 C C CAGCACAAC CAC AT CAGAT T C GAC GGCT CAAGAGGGGTAT GAGT CT AGG G GAGGAAT G 18 09 



Db 2050 CCCAGCACAACCACAT CAGATT CGACGGCTCAAGAGGGGTAT GAGT CT AGGGGAGGAAT G 2109 

Qy 1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 18 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 2110 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 2169 

Qy 187 0 T C C CAT AAT CAC CAAGACAAGAAGG GAGT GAT T CGG GAAAGT TAC CT CAAAGGCC AC GAC 1929 

II I I I I I I I I M I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 217 0 T C C CAT AAT CAC CAAGACAAGAAGGGAGT GAT T CGGGAAAGT T AC CT CAAAGGC C AC GAC 2229 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 19 89 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2230 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 2289 

Qy 1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2 049 

I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 
Db 2290 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2349 

Qy 2050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2350 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 24 09 

Qy 2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2410 AAGCTCAGCGGCCTCTTTGGGGACACTCATCCAAAAGACCCAAAGCCGGAGGCCATCCTC 24 69 

Qy 217 0 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2229 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 247 0 ACGCCACTCATGCACAACGGC7^AGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2529 

Qy 2230 AAAG CAGAC CAG CAC CAC CT GGAC CT GAC GG C C CT C CCC AC C C CAGAGT CAAC C C CAAC G 2289 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2530 AAAGCAGAC CAGCAC CAC CT GGAC CT GAC GG C C CT CCC CAC C C CAGAGT CAAC CC CAAC G 2589 

Qy 2290 CT GCAGCAGAAGC GGAAG C CC AGC C G CG G CAGC C G C GAGT GG GAGAGGAAC CAGAACCT C 2349 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2590 CT GCAGCAGAAGC GGAAGC C C AGC C GCG GCAGC C G C GAGT GGGAGAGGAAC CAGAACCT C 2 649 

Qy 2350 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 24 09 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I 
Db 2650 AT CAAT G C C T GCACAAAG GAC AT GC C CC C CAT GGGCTCCCCTGT GAT T CCCACGGACC T G 27 09 

Qy 2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2469 

I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2710 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 27 69 

Qy 247 0 GGCT ACC AG CAT GAG TAC GT G GAC CAGC C CAAAAT GAGC GAGGT G GCC CAGAT GGC GCT G 2529 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 
Db ; 27 70 GGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTG 2829 

Qy 253 0 GAGGACCAGGC C GC C ACACT GGAGTATAAGAC CAT CAAGGAAC AT CT C AGCAG CAAGAGT 2589 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 28 30 GAGGACCAGGC C GC C ACACT G GAGTAT AAGAC CAT CAAGGAACAT CT CAGCAGCAAGAGT 2889 



Qy 



25 90 CCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAG 2 649 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2890 



C C CAAC CAT GG GGT GAAC CTT GT GGAGAAC CT GGAC AG CCTGCCCCC CAAAGT T C C AC AG 2949 



Qy 2 650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 27 09 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 

Qy 2710 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 27 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I II I I I I I I I I I I 
Db 3010 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 3069 

Qy 277 0 T C GCT CAC GAGAAGC CAC C AGGC CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 2829 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 307 0 T C GCT CAC GAGAAGC CAC C AGGC CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 3129 

Qy 2 830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 2889 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 3130 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3189 

Qy 2 890 CAGAGGGT GGACT CCAT CCAGGT GCACAGCTCCCAGCCAT CT GGCCAGGCCGT GACTGT C 2949 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3190 CAGAGGGT GGACT CCAT CCAGGT GCACAGCTCCCAGCCAT CT GGCCAGGCCGT GACT GT C 324 9 

Qy 2 950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 3250 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3309 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3310 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 

Qy 3070 AAGCC CAAT GAT GCGT GTACATAA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 337 0 AAGC C CAAT GAT GCGT GTACATAA 3393 



RESULT 6 
AAH18729 

ID AAH18729 standard; cDNA; 6060 BP. 
XX 

AC AAH18729; 
XX 

DT 26-JUN-2001 (first entry) 
XX 

DE Human cDNA sequence SEQ ID NO: 19004. 
XX 

KW Human; primer; detection; diagnosis; antisense therapy; gene therapy; ss . 
XX 

OS Homo sapiens. 
XX 

PN EP1074617-A2. 
XX 

PD 07-FEB-2001. 
XX 

PF 28-JUL-2000; 2 000EP-00116126 . 
XX 

PR 29-JUL-1999; 99 JP-0024 8 036 . 

PR 27-AUG-1999; 99 JP-00300253 . 



PR ll-JAN-2000; 2000 JP-0011877 6 . 

PR 02-MAY-2000; 2000 JP-00183767 . 

PR 09-JUN-2000; 2000 JP-00241899 . 
XX 

PA (HELI-) HELIX RES INST. 
XX 

PI Ota T , Isogai T, Nishikawa T, Hayashi K, Saito K, Yamamoto J; 

PI Ishii S, Sugiyama T, Wakamatsu A, Nagai K, Otsuki T; 

XX 

DR WPI; 2001-318749/34. 
XX 

PT Primer sets for synthesizing polynucleotides, particularly the 5602 full- 

PT length cDNAs defined in the specification, and for the detection and/or 

PT diagnosis of the abnormality of the proteins encoded by the full-length 

PT cDNAs . 
XX 

PS Claim 8; SEQ ID NO 19004; 2537pp + Sequence Listing; English. 
XX 

CC The present invention describes primer sets for synthesising 5602 full- 

CC length cDNAs defined in the specification. Where a primer set comprises: 

CC (a) an oligo-dT primer and an oligonucleotide complementary to the 

CC complementary strand of a polynucleotide which comprises one of the 5602 

CC nucleotide sequences defined in the specification, where the 

CC oligonucleotide comprises at least 15 nucleotides; or (b) a combination 

CC of an oligonucleotide comprising a sequence complementary to the 

CC complementary strand of a polynucleotide which comprises a 5 '-end 

CC sequence and an oligonucleotide comprising a sequence complementary to a 

CC polynucleotide which comprises a 3 '-end sequence, where the 

CC oligonucleotide comprises at least 15 nucleotides and the combination of 

CC the 5 ' -end sequence/3 1 -end sequence is selected from those defined in the 

CC specification. The primer sets can be used in antisense therapy and in 

CC gene therapy. The primers are useful for synthesising polynucleotides, 

CC particularly full-length cDNAs . The primers are also useful for the 

CC detection and/or diagnosis of the abnormality of the proteins encoded by 

CC the full-length cDNAs . The primers allow obtaining of the full-length 

CC cDNAs easily without any specialised methods. AAH03166 to AAH13628 and 

CC AAH13633 to AAH18742 represent human cDNA sequences; AAB92446 to AAB95893 

CC represent human amino acid sequences; and AAH13629 to AAH13632 represent 

CC oligonucleotides, all of which are used in the exemplification of the 

CC present invention 

XX 

SQ Sequence 6060 BP; 1639 A; 1526 C; 1363 G; 1532 T; 0 U; 0 Other; 

Query Match 96.0%; Score 2969.6; DB 4; Length 6060; 
Best Local Similarity 99.8%; Pred. No. 0; 

Matches 2 994; Conservative 0; Mismatches 4; Indels 2; Gaps 2; 

Qy 96 C AACT AT ACAAAACAGTAT C C GGT GT T T GT GGG C CACAAG C CAGGAC G GAACAC CACACA 155 

I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1 CAACTATACAAAACAGTAT CC GGT GTTT GT GGGC CACAAGCCAGGAC GGAACAC CACACA 60 

Qy 156 GAG GCACAGGCT G GAC AT C CAGAT GAT TAT GAT CAT GAAC GGAAC C CT CT ACAT T G CT GC 215 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GAGGCACAGGCT GGACATCCAGGT GATT AT GAT CAT GAACGGAACCCT CTACATT GCT GC 120 



Qy 216 TAGGGAC CAT AT T TAT ACT GT T GAT AT AG AC AC AT C ACAC ACGGAAGAAAT T TAT T GT AG 275 

I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 121 TAG GGAC CAT AT T TAT AC T GT T GAT AT AGAC AC AT C AC AC AC GGAAGAAAT T T ATT GT AG 18 0 

Qy 276 C AAAAAACT GAC AT G GAAAT C T AGAC AGGC C GAT GT AGAC AC AT G C AGAAT GAAGG GAAA 335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 C AAAAAACT GACATGGAAAT CT AGACAGGC CGAT GT AGAC AC AT GC AGAAT GAAGGGAAA 24 0 

Qy 336 ACATAAGGAT GAGT GC CACAACT T TAT TAAAGTT CT T CTAAAGAAAAAC GAT GATGC AT T 395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 241 ACATAAGGAT GAGT G C CACAAC T T TAT TAAAGT T CT T CTAAAGAAAAAC GAT GAT G CAT T 30 0 

Qy 396 GT T T GT CT GT GGAACT AAT GCCT T CAACC CT T C CT GCAGAAAC T AT AAGAT GGAT AC ATT 455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 301 GTTTGTCTGTGGAACTAATGCCTTCAACCCTTCCTGCAGAAACTATAAGATGGATACATT 360 

Qy 456 GGAAC CATTC GGGGAT GAATTCAGCGGAAT GGCCAGATGCCCATAT GAT GC CAAACAT GC 515 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 
Db 361 GGAAC C ATT C GG GGAT GAAT T C AGCGGAAT GGCCAGAT GC C CAT AT GAT GC CAAACAT GC 42 0 

Qy 516 CAAC GT T GCACT GT TT GCAGAT GGAAAAC TAT ACT C AGC C ACAGT GACT GACT T CCTT GC 575 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 421 CAAC GT T GCACT GT TT GCAGAT GGAAAACT AT ACT C AGC C ACAGT GACT GACT T CCT T GC 480 

Qy 576 CATTGACGCAGTCATTTACCGGAGTCTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCA 635 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I I I I I 
Db 481 CATTGACGCAGTCATTTACCGGAGTCTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCA 54 0 

Qy 636 C GAT T CAAAAT G GTT GAAAGAAC CAT ACT T T GT T CAAGC C GT GGAT T AC GGAGAT TAT AT 695 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 541 C GATT CAAAAT GGTT GAAAGAAC CAT ACT T T GT T CAAGC C GT GGAT T AC G GAGAT TAT AT 60 0 

Qy 696 CT ACTT CTT CT T C AGGGAAAT AGCAGT GGAGT AT AAC AC C AT GGGAAAGGT AGT T T T C CC 755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 601 CT ACTT CTT CTT C AG GGAAAT AGCAGT GGAGTATAAC AC C AT GGGAAAG GT AGT T T T C CC 660 

Qy 756 AAGAGT GGCT CAGGTTT GTAAGAATGATAT GGGAGGAT CT CAAAGAGTCCT GGAGAAACA 815 

I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 661 AAGAGT GGCT CAGGTTT GTAAGAATGATAT GGGAGGATCT CAAAGAGTCCTGGAGAAACA 720 

Qy 816 GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 875 

I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTA 780 

Qy 876 T T T CAAC AT T CT C CAGGCAGT T ACAGAT GT GATT CGT AT CAAC GGGC GT GAT GT T GT C CT 935 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TT T CAACAT T CT C CAGG CAGT T ACAGAT GT GATT CGT AT CAAC GGGC GT GAT GT T GT C CT 840 

Qy 936 GGCAAC GTT T T CT AC AC CT TATAACAGCAT C CCT GG GT CT GCAGT CT GT GC CT AT GAC AT 995 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GGCAACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACAT 900 

Qy 996 GCT T GAC AT T GC CAGT GTT TT T AC T G GGAGATT CAAGGAACAGAAGT CTC CT GAT T C CAC 1055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I 
Db 901 GCTT GACAT T GC C AGT GTT T T TACT GGGAGATT CAAGGAACAGAAGT CTC CT GAT T C CAC 960 

Qy 1056 CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 1115 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 961 CTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTC 102 0 



Qy 1116 AT CCT CCTTAGAAAGATAT GCAACCTCCAAT GAGTT CC CT GAT GATACCCT GAACTTCAT 1175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 AT C C T C C T T AG AAAG AT AT G C AAC C T C C AAT GAG T T C C C T GAT GAT AC CCT G AAC T T CAT 1080 

Qy 1176 CAAGAC GCACC C GCT CAT GGAT GAGG CAGT GC C CT C CAT CTT CAACAGGC C AT GGT T C CT 1235 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CAAGAC GCACC C GCT CAT G GAT GAGG CAGT GC C CT C CAT CT T CAACAGGC CAT GGT T C C T 1140 

Qy 1236 GAGAACAAT GGT CAGATACCGC CTT ACCAAAATTGCAGT GGACAC AGCT GCT GGGCCAT A 1295 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GAGAACAAT GGT CAGATACCGC CTT ACCAAAATTGCAGT GGACACAGCTGCT GGGCCAT A 1200 

Qy 1296 T C AGAAT C ACACT GT G GT T T T T CT GGGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GG C 1355 

I i I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i II I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 T CAGAAT C ACAC T GT G GT T T T T CT GGGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GGC 1260 

Qy 1356 CAGAAT AG GAAAT AGT GGT T T T CT AAAT GAC AGCCT T T T C CT G GAGGAGATGAGT GTTT A 1415 

I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1261 C AGAAT AGGAAAT AGT GGT T T T CT AAAT GACAGCCT TT T CCT GGAGGAGAT GAGT GT TT A 1320 

Qy 1416 CAAC T CT G- AAAAAT GCAG CT AT GAT GGAGT C GAAGACAAAAGGAT CAT GGGCAT GCAG C 14 74 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CAACT CT GAAAAAAT GCAGCT AT GAT GGAGTC GAAGACAAAAGGAT CAT GGGCAT GCAGC 1380 

Qy 1475 TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 1534 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 1440 

Qy 1535 T T GG C C GGT GT GAAC GACAT G GGAAGT GT - AAAAAAAC CT GTAT T G C CT C C AGAGAC C C A 1593 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1441 T T GGC C GGT GT GAAC GACAT G GGAAGT GT AAAAAAAAC CT GTAT T G C CT C CAGAGAC C C A 1500 

Qy 1594 TAT T GT GGAT GGAT AAAGGAAGGT GGT GC CT GCAGC CAT T TAT CAC C CAAC AG CAGACT G 1653 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I II I I I I I I I II 
Db 1501 TAT T GT GGAT GGAT AAAGGAAGGT GGT G C CT GCAGC CAT T TAT CAC C CAACAGCAGACT G 1560 

Qy 1654 ACT T TT GAGCAGGAC AT AGAGC GT G G CAAT ACAGAT G GT CT GGGGGACT GTC ACAAT T C C 1713 

M I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 

Db 1561 ACT T TT GAGCAGGACAT AGAGC GT G G CAAT ACAGAT GGT CT GG GG GACT GT C ACAAT T C C 162 0 

Qy 1714 T T T GT GGC ACT GAAT G GGCATT C CAGT TCCCTCTTGCC C AGCACAAC CAC AT CAGAT T C G 1773 

I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 1621 T T T GT GGC AC T GAAT GGGC ATT CT AGT TCCCTCTTGCC CAGCACAAC CACAT CAGAT T C G 168 0 

Qy 1774 AC GG CT CAAGAGGGGT AT GAGT CT AG GG GAGGAAT GCT GGACT GGAAGCATCT GCT T GAC 1833 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 AC GG CT CAAGAGG GGT AT GAGT CT AG GG GAGGAAT GCT GGACT GGAAGCAT CT GCT T GAC 174 0 

Qy 1834 T C AC CT GACAGCACAGAC C CTT T GG G GGCAGT GT CTT C C CAT ANT CAC CAAGAC AAGAAG 1893 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
Db 1741 T CACCT GACAGCACAGACCCTTT GGGGGCAGT GTCTT CCCATAAT CAC CAAGAC AAGAAG 18 00 

Qy 1894 GGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTG 1953 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I M I I I I I I I I I 
Db 1801 GGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTG 18 60 



Qy 

Db 



1954 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 2013 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I 
18 61 GCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTAC 1920 



Qy 2014 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 2073 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTC 198 0 

Qy 2074 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 2133 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 ACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGAC 204 0 

Qy 2134 ACT CAAT C CAAAGAC CCAAAGC C GGAGGCC AT C CT CAC GC C ACT CAT GCACAAC GGCAAG 2193 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ACT CAAT C CGAAGAC C CAAAGC C GGAGGCC AT C CT CAC GC C ACT CAT GCACAAC GGCAAG 2100 

Qy 2194 CTCGCCACTCCCGGCAACACGGCCAAGATGCTCATTAAAGCAGACCAGCACCACCTGGAC 2253 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CTCGCCACTCCCGGCAACACGGCCAAGATGCTCATTAAAGCAGACTAGCACCACCTGGAC 2160 

Qy 22 54 CTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGC 2 313 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I 

Db 2161 CTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGC 2220 

Qy 2314 C GC GGCAG C C GCGAGT G G GAGAGGAAC CAGAAC CT CAT CAAT GC CT GCACAAAG GACAT G 2373 

I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2221 C GC G GCAGC C GCGAGT GGGAGAGGAAC CAGAAC CT CAT CAAT GC CT GC ACAAAGGACAT G 22 80 

Qy 2374 CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 2433 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 22 81 CCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCAC 234 0 

Qy 2434 ATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGAC 2493 

I I I I I II I I II I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2341 ATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGAC 2400 

Qy 24 94 CAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGAG 2553 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 4 01 CAG C C CAAAAT GAGCGAGGT GGC C CAGAT GGCGCT GGAGGACC AGG C C GC CAC ACT G GAG 2460 

Qy 2554 TATAAGACCAT CAAGGAACAT CT CAGCAGCAAGAGT CCCAACCATGGGGT GAACCTT GTG 2613 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2461 TATAAGACCAT CAAGGAACAT CT CAGCAGCAAGAGT CCCAACCAT GGGGT GAACCTT GTG 2520 

Qy 2614 GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 2673 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I II I I I 

Db 2 521 GAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCG 2580 

Qy 2674 GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 2733 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I M I I I I II I I II I I I I I I I I 

Db 2581 GGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCC 264 0 

Qy 2734 T AC GG GGTT GACT AT AAGAGGAGCT AC C C C ACGAACT C GCT CAC GAGAAGC CAC CAGGCC 2793 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 TAC GGGGTT GACT ATAAGAG GAG C T AC C C C ACGAACT C GCT CAC GAGAAGC CAC CAGGCC 27 00 

Qy 2794 AC C ACT CTCAAAAGAAAC AACACT AACT C CT C CAAT T CCT C T C ACC T CT C CAGAAAC CAG 2853 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

27 01 ACCACT CT CAAAAGAAACAACACTAACT CCT CCAATT CCT CT CACCT CTCC AGAAACCAG 2760 

2854 AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 2913 

I I M I I I I I I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I 

27 61 AGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTG 2 82 0 

2 914 CAC AGCT C CCAGC CAT CT GG C CAGGCC GT GACT GT CT C GAG GC AG CC CAGC CT CAAC G CC 2973 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

2 821 CACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCC 28 80 

2 974 TACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCC 3033 

I I I |J M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

28 81 TACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCC 2 94 0 

3034 CC CAAAC CAT C CT TTGCTCCCCTT T CCACAT CC AT GAAGC C CAAT GAT GC GT GT ACAT AA 3093 

I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I 
2941 C C CAAAC CAT C CT TTGCTCCCCTTTC C ACAT CC AT GAAGC C CAAT GAT GC GT GT AC AT AA 3000 
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AAV44295 standard; cDNA; 3550 BP. 
AAV44295; 

06-OCT-1998 (first entry) 

Human secreted protein clone CJ145_1 cDNA. 

Secreted protein; human fetal brain; nutrition; cytokine; stimulant; 
cell proliferation; differentiation; immune system; suppressor; ligand; 
regulator; hematopoiesis ; tissue growth; activin; inhibin; haemostatic; 
chemotaxis; chemokinetic; thrombosis; receptor; cadherin; tumour; 
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Location/ Qualifiers 
126. .3053 
/*tag= a 

/product^ "secreted protein" 
/note= "isolated from clone CJ145 



1" 



97WO-US023330. 

96US-00769192. 
97US-00783401. 
97US-00991872. 



(GEMY ) GENETICS INST INC. 

Jacobs K, Mccoy JM, Lavallie ER, 



Racie LA, Merberg D, Treacy M; 



PI Spaulding V, Agostino MJ; 
XX 

DR WPI; 1998-362774/31. 

DR P-PSDB; AAW64221. 
XX 

PT New polynucleotides and secreted proteins - obtained from human foetal 

PT brain, human adult testes, human adult brain and human adult salivary 

PT gland cDNA libraries. 
XX 

PS Claim 17a; Page 69-71; llOpp; English. 
XX 

CC This sequence encodes a novel secreted protein from clone CJ145_1 

CC isolated from a human fetal brain cDNA library. This protein has 

CC applications for nutritional use, cytokine and cell 

CC proliferation/differentiation activity, immune stimulating or suppressing 

CC activity, hematopoiesis regulating activity, tissue growth activity, 

CC activin/inhibin activity, chemotactic/chemokinetic activity, haemostatic 

CC and thrombotic activity, receptor/ligand activity, anti-inflammatory 

CC activity, cadherin/tumour invasion suppressor activity, tumour inhibition 

CC activity and other activities 

XX 

SQ Sequence 3550 BP; 957 A; 994 C; 856 G; 742 T; 0 U; 1 Other; 



Query Match 88.8%; Score 2746.2; DB 2; Length 3550; 

Best Local Similarity 94.5%; Pred. No. 0; 

Matches 2923; Conservative 1; Mismatches 4; Indels 165; Gaps 1; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I 1 I I I I I I ! I I I I I I I I I I I i I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 126 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 185 

Qy 61 CC AGAAGATT CT GAGC CAAT C AGT AT T T C GCAT G GCAACT AT ACAAAACAGT AT C C GGT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 186 CC AGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT GGCAACT AT ACAAAACAGT AT C C G GT G 24 5 

Qy 121 TT T GT GGGC CACAAG C CAG GAC GGAACAC C AC ACAGAGGCACAG GCT GGAC AT C CAGAT G 18 0 

I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I II I I I I I I I I I II I I I I i I I I I I I I I I I 
Db 246 TTT GT GGGCCACAAGC CAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGATG 305 

Qy 181 AT TAT GAT CAT GAAC GGAACC CT CTACAT T GCT G CT AGGGAC CAT AT TTAT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I 
Db 306 ATTAT GATCATGAACGGAACCCT CTACATT GCT GCTAGGGACCAT ATTTATACT GTT GAT 365 

Qy 241 AT AGAC ACAT CAC AC AC G GAAGAAATT T AT T GTAGCAAAAAACT GACAT GGAAAT CT AGA 30 0 

I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
Db 366 AT AGACACAT CACACACS GAAGAAATTTATTGTAGCAAAAAACT GACAT GGAAATCT AGA 425 

Qy 301 CAGGC C GAT GT AGAC ACAT G CAGAAT GAAGGGAAAACAT AAGGAT GAGT G C CACAACT T T 360 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I II I I I 

Db 426 CAG GC C GAT GTAGAC ACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACT T T 485 

Qy 361 AT T AAAGT T CTT CT AAAGAAAAACGAT GAT GCAT T GT TT GT CT GT GGAACT AAT GC CT T C 420 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I I I 
Db 4 86 ATTAAAGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 545 

Qy 421 AAC CCT T C CT G C AGAAACTAT AAGAT GGAT AC AT T G GAAC CAT T C GGGGAT GAATT C AG C 48 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



54 6 AAC C CT T C CT GCAGAAACT AT AAGAT GGAT ACAT T GGAAC C ATT C GGGGAT GAAT T C AGC 605 



Qy 481 GGAAT GGCCAGAT GCCCATAT GAT GCCAAACATGC CAACGTTGCACT GTTT GCAGAT GGA 540 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 606 GGAAT GGC CAGAT GC C CAT AT GAT GCCAAAC AT GC CAACGT T G C ACT GTT T GCAGAT GGA 665 

Qy 541 AAAC TAT ACT C AGC CAC AGT GACT GACT T CCT T GC CAT T GAC G C AGT CAT T T AC C GGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 666 AAACT AT ACT CAGC CAC AGT GACT GACTT C CT T GC CAT T GAC G C AGT CAT T T AC C GGAGT 725 

Qy 601 CTT GGAGAAAGCCCTACCCT GCGGACCGTCAAGCACGATT CAAAATGGTT GAAAGAACCA 660 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 72 6 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 7 85 

Qy 661 T ACT T T GT T CAAGC C GT GGAT T AC G GAGAT TAT AT CT ACT T CT T CTT CAGGGAAAT AGCA 720 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 86 TACT T T GT T CAAGC C GT G GAT T AC GGAGAT TAT AT CT ACT T CT T CTT CAGGGAAAT AGCA 8 45 

Qy 721 GTGGAGT ATAACAC CAT G GGAAAGGT AGTTT T C C CAAGAGT GGCT CAGGT T T GT AAGAAT 780 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I M I I I I I M I I I I I I I I 

Db 84 6 GT G GAGT ATAACAC CAT G GGAAAGGT AGT TT T C C CAAGAGT GG CT CAGGT T T GTAAGAAT 905 

Qy 7 81 GAT AT GGGAG GAT CT CAAAGAGT CCT GGAGAAAC AGT GGAC GT C GTT C CT GAAG GCG C GC 840 

II I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 906 GAT ATGGGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGACGT C GTTCCT GAAGGCGCGC 965 

Qy 841 T TGAACT GCT CAGT T C CT GGAGACT CT CAT TT TT ATT T CAACAT T CT C CAGG C AGTT ACA 900 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 966 T T GAACT GCT CAGT T C CT G GAGACTCT CAT T T TT ATT T CAACAT T CT C CAG GC AGTT ACA 1025 

Qy 901 GAT GT GAT T C GT AT CAAC GGG CGT GAT GTT GT C CT GGCAAC GTT T T CT ACAC CT T ATAAC 960 

II I M I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 6 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 1085 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 
Db 1086 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1145 

Qy 1021 GGGAGATT CAAGGAACAGAAGTCT CCT GATT CCACCT GGACAC CAGTT CCT GAT GAACGA 1080 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 1146 GG GAGAT T CAAG GAAC AGAAGT CT CCT GAT T C C ACCT GGACAC CAGTT CCT GAT GAAC GA 1205 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I 
Db 1206 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 12 65 

Qy 1141 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC GCACC C GCT CAT GGAT GAG 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1266 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACTT C AT CAAGAC GCACC C GCT CAT GGAT GAG 1325 

Qy 1201 GC AGT GC CCT CC AT CTT CAACAGGC CAT GGT T C CT GAGAACAAT GGT CAGAT AC C GC CTT 12 60 

I I I I I I II I I I II I I I I I I II I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I 

Db 1326 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 1385 

Qy 1261 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1320 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
Db 138 6 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1445 



Qy 1321 GGAT C AGAGAAG G GAAT CAT CT T GAAGT T T TT G GC CAGAAT AGGAAAT AGT GGT T T T CT A 1380 

I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
Db 1446 G GAT C AGAGAAGG GAAT CAT CT T GAAGT T T TT G GC CAGAAT AGGAAAT AGT GGT T T T CT A 1505 

Qy 1381 AAT GACAGC CTT T T C CT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT G CAGCT AT GAT 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1506 AATGACAGCCTTTTCCTGGAGGAGAT GAGT GTTT ACAACT CT GAAAAAT GCAGCTAT GAT 1565 

Qy 1441 GGAGT C GAAGACAAAAGGAT CAT GGGCAT G CAG CT GGAC AGAGCAAGC AGCT CT CT GTAT 1500 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1566 G GAGT C GAAGACAAAAGGAT CAT GGGCAT GCAG CT G GAC AGAGCAAGCAGCT CT CT GTAT 1625 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 162 6 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1685 

Qy 1561 T GT AAAAAAAC CT GT ATT GC CT CCAGAGAC C CAT AT T GT GGAT GGATAAAGGAAGGT GGT 1620 

I I I I I I II I I I I I I I I II I I I II I I M I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1686 T GT AAAAAAAC CT GT ATT GC C T C CAGAGAC C CAT AT TGT GGAT GGAT AAAGGAAGGT GGT 1745 

Qy 1621 GC CT GCAGCCAT T TAT CAC C CAACAG C AGACT GACT TT T GAGCAGGAC AT AGAGC GT GGC 1680 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 174 6 GC CT GCAG C CAT T TAT CAC C CAACAGCAGACT GACT TT T GAGCAGGACAT AGAGC GT GGC 18 05 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 1740 

I I I I I I I I I I I I I I I I I II I I I I I I II I I II I I I I M I I I I I I I I M I 

Db 1806 AAT AC AGAT GGT CT GGGGGACT GT C ACAAT T C CTT T GT GGCACT GAAT 18 53 

Qy 1741 T C CCT CTT GCC C AGCACAACCACAT CAGAT T CGAC G GCT CAAGAGGGGT AT GAGT CT AGG 18 00 

Db 1854 1853 

Qy 1801 GGAGGAAT GCT G GACT GGAAG CAT CT GCT T GACT C ACCT GACAGC ACAGAC C CTT T GGGG 18 60 

Db 1854 1853 

Qy 1861 GCAGT GT CTT C C CAT AAT CAC CAAGACAAGAAGG GAGT GAT T C G GGAAAGT T ACCT CAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1854 GGAGT GAT T C GGGAAAGT T ACCT CAAA 1880 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 19 80 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 18 81 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1940 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1941 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2000 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I 
Db 2001 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2060 

Qy 2101 AGCGT CAC CAAGCT CAGC GG C C T CT T T G GG GACACT CAATC C AAAGAC C CAAAGCC GGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 2061 AGC GT CAC CAAGCT CAGC GGCCTCTTTGGGGACACTCAATCCAAAGACC CAAAGCC GGAG 2120 



1 



Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2121 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2180 

Qy 2221 AT GCT CAT T AAAGCAGAC CAGC AC CAC CT GGACC T GAC G GC C CT C CCC ACC C CAGAGT CA 2280 

I I I I I I I I I I I M I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2181 AT GCT CAT T AAAGCAGAC CAGC AC CAC CT GGACC T GAC GGCCCTCCC C ACC C CAGAGT CA 2240 

Qy 2281 AC CC CAAC G CT GCAG CAGAAG C GGAAGC C C AG CC GC GGCAGC C G C GAGT GGGAGAGGAAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2241 AC CC CAAC GCT GCAG CAGAAG C GGAAGC C CAGCC GC GGCAGC C GC GAGT GGGAGAGGAAC 2300 

Qy 2341 C AGAACCT CAT CAAT GC CT GC ACAAAGGACAT GC C C C C CAT GGGCT C C C CT GT GATTC C C 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2301 CAGAACCT CAT CAAT GC CT GC ACAAAGGACAT GC C C C C CAT GGGCT C C C CT GT GAT T C C C 2360 

Qy 24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I 
Db 2361 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2420 

Qy 24 61 AC G C AGCAGGGCTAC CAGCAT GAGT AC GT GGACC AGC C CAAAAT GAGC GAGGT GGC CCAG 2520 

I I I I I I I I I I I I I I II I I I I I II I I I I I M I I I M II I I II I I I I I I I I M I I I I I I I I I 
Db 2421 AC GC AGCAGGGCTAC CAGCAT GAGT AC GT GGACCAGC C CAAAAT GAGC GAGGT GGC CCAG 2480 

Qy 2521 AT GGC GCT GGAG GAC CAGGC C GC C ACACT GGAGT AT AAGACCAT CAAG GAACAT CT CAGC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I 
Db 24 81 AT GGC GCT GGAG GAC CAGGC C GCC ACACT G GAGT AT AAGAC CAT CAAGGAACATT T CAGC 2540 

Qy 2581 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 2640 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2541 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 2600 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I II 

Db 2601 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTTTCAGACCGGTTTA 2660 

Qy 27 01 AGCAAGC GGCT GGAAAT GCACCACT CCT CTT CCT ACGGGGTT GACTATAAGAGGAGCT AC 27 60 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2661 AGCAAG C GGCT GGAAAT G CAC CACT CCT TT T C CT ACG GGGT T GACTATAAGAGGAGCT AC 2720 

Qy 2761 CCCACGAACTCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTAAC 2 82 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2721 CCCACGAACT C GCT CACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTAAC 27 80 

Qy 2821 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 288 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 
Db 27 81 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 284 0 

Qy 2 8 81 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2940 

I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 841 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2900 

Qy 2 941 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 3000 

I I I I I || I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I 

Db 2 901 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 2960 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2 961 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 302 0 

Qy 3061 AC AT C CAT GAAG C C C AAT GAT G C GT GT AC AT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3021 AC AT C CAT GAAGC C C AAT GAT G C GT GT AC AT AA 3053 



RESULT 8 
AAF98469 

ID AAF98469 standard; cDNA; 3550 BP. 
XX 

AC AAF98469; 
XX 

DT 07-JUN-2001 (first entry) 
XX 

DE Human cDNA clone CJ145_1 sequence SEQ ID 160. 
XX 

KW Human; secreted protein; nutrient; cytokine modulator; proliferation; 

KW differentiation; immune system modulator; tissue growth; chemotactic; 

KW haemostatic; thrombolytic; anti-inflammatory; tumour inhibition; ss; 

KW haematopoiesis . 
XX 

OS Homo sapiens . 
XX 

PN WO200119988-A1. 
XX 

PD 22-MAR-2001. 
XX 

PF 14-SEP-2000; 2000WO-US025135 . 
XX 

PR 17-SEP-1999; 99US-00398829 . 
XX 

PA (GEMY ) GENETICS INST INC. 
XX 

PI Jacobs K, Mccoy JM, Lavallie ER, Collins-Racie LA, Evans C; 

PI Merberg D, Treacy M, Bowman MR, Spaulding V, Agostino MJ; 
XX 

DR WPI; 2001-244801/25. 

DR P-PSDB; AAB90731. 
XX 

PT Isolated nucleic acids encoding polypeptides, useful for modulating e.g. 

PT cytokine and cell proliferation/differentiation activity, the immune 

PT system and hematopoiesis regulating activity. 
XX 

PS Disclosure; Page 486-487; 557pp; English. 
XX 

CC Human cDNA clones represented in AAF98374 - AAF98489 encode secreted 

CC proteins AAB90667 - AAB90750. The cDNA clones are isolated from various 

CC tissue types, and may be used in the prevention, treatment and diagnosis 

CC of diseases associated with inappropriate protein expression. The 

CC polypeptides and nucleic acids may be used as nutrients or to modulate 

CC cytokine and cell prolif eration/dif f erentiation activity and may also be 

CC involved in modulation of the immune system. The cDNA sequences, 

CC proteins, their agonists and/or antagonists exhibit haematopoiesis 

CC regulating activity; tissue growth activity; activin/inhibin activity; 

CC chemotactic/chemokinetic activity; haemostatic and thrombolytic activity; 



CC receptor/ligand activity; anti-inflammatory activity; haematopoiesis 

CC activity; cadherin/tumour suppressor activity; and/or tumour inhibition 

CC activity. Included in the invention are probes represented in AAF98490 - 

CC AAF98572 which are specific for the cDNA clones encoding the secreted 

CC proteins 
XX 

SQ Sequence 3550 BP; 957 A; 994 C; 856 G; 742 T; 0 U; 1 Other; 

Query Match 88.8%; Score 2746.2; DB 5; Length 3550; 

Best Local Similarity 94.5%; Pred. No. 0; 

Matches 2923; Conservative 1; Mismatches 4; Indels 165; Gaps 1; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 6 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 185 

Qy 61 C CAGAAGAT T C T GAG C CAAT C AGT AT TT C GC AT G G CAACT AT ACAAAACAGT AT C C GGT G 120 

I I I I I I I I I I I I I II I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 18 6 C CAGAAGAT T CT GAG C CAAT C AGT AT TT C GC AT GGCAACT AT ACAAAACAGT AT C C GGT G 24 5 

Qy 121 TTTGT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 24 6 TTTGT GGGCCACAAGCCAGGACGGAACAC CACACAGAGGCACAGGCTGGACAT CCAGAT G 305 

Qy 181 AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T GCTG CT AGG GAC CAT ATT TAT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I I I I I I 
Db 306 AT TAT GAT CAT GAAC GGAACC CT CT ACAT T GCTGCT AGG GAC CAT ATT T AT ACTGT TGAT 365 

Qy 241 ATAGACAC AT C ACACAC GGAAGAAAT TT ATT GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I I I I I I I I I I I I I I II I : I I I I I I I I I II I I I I I I I I I I II I I I I I II I I I I I I I I I I I I 
Db 366 ATAGACACATCACACAC S GAAGAAATTTATTGTAGCAAAAAACT GACAT GGAAAT CTAGA 425 

Qy 301 C AGGC C GAT GT AGACACAT G CAGAAT GAAGG GAAAACATAAGGAT GAGT GC C ACAACT T T 360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 6 C AGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC C ACAACTT T 4 85 

Qy 361 AT TAAAGT T CT T CT AAAGAAAAAC GATGAT GCAT T GTT T GT CT GT G GAACTAAT GC CTT C 420 

M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 486 AT TAAAGT T CT T CT AAAGAAAAAC GATGAT GCAT T GTT T GT CT GT GGAAC TAAT GCCT T C 545 

Qy 421 AACCCTT CCTGCAGAAACTATAAGAT GGATACATT GGAACCATT CGGGGATGAATTCAGC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 6 AACCCTT CCTGCAGAAACTATAAGAT GGATACATT GGAACCATT CGGGGATGAATTCAGC 605 

Qy 4 81 GGAAT GGC CAGAT GC C CAT AT GAT GC CAAAC AT GC CAAC GT T GC ACT GT T T GCAGAT GGA 54 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 606 GGAAT GGC CAGAT GC C CAT AT GAT GC CAAACAT GC CAAC GTT GC ACT GT T T GCAGAT GGA 665 

Qy 541 AAACT AT ACT C AGC C AC AGT GAC T GACT T CCT T GC CAT T GAC GCAGT CAT TT ACC GGAGT 600 

I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 666 AAACT AT ACT C AGC C AC AGT GAC T GACT T CCT T GC CAT T GAC GCAGT CAT T T ACC GGAGT 725 

Qy 601 CT T G GAGAAAG C C CT AC C CT GC GGAC C GT CAAGC AC GAT TCAAAAT GGT T GAAAGAAC CA 660 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 72 6 C T T G GAGAAAG C C C T AC C C T G C G GAC C GT C AAG C AC GAT T C AAAAT G GT T GAAAGAAC C A 785 



Qy 661 



TACT T T GTT CAAGC C GT G GAT T AC G GAGATT AT AT CTAC TT CTT CTT CAGGGAAAT AGCA 72 0 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 78 6 TACT T T GT T CAAGC C GT GGAT T AC GGAGATT ATAT CTACT T C T T CT T C AGGGAAATAG C A 845 

Qy 721 GT GGAGT ATAACAC CAT G G GAAAG GT AGT TTT C C CAAGAGT GGCT C AGGT T T GT AAGAAT 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I 

Db 84 6 GT GGAGT ATAACAC CATGGGAAAGGTAGTTTT CCCAAGAGT GGCT CAGGT TT GT AAGAAT 905 

Qy 781 GAT AT G GGAGGAT CT CAAAGAGT C CT GGAGAAACAGTGGAC GT C GTT C CT GAAGG C GC GC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I II I 
Db 906 GAT AT G GGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT CGT T C CT GAAGGC GC GC 965 

Qy 841 T T GAACT GCT C AGTT C CT GGAGACT CT C AT TTT T ATTT CAAC ATT CT C C AGGCAGT T AC A 900 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 966 T T GAACT GC T C AGTT C CT G GAGACT C T C ATT T T T AT TT CAAC ATT CTC C AGG CAGTT AC A 1025 

Qy 901 GAT GT GAT T C GT AT CAAC GGG C GT GAT GT T GT C CT GGCAACGTTT T CT ACAC CTT ATAAC 960 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 
Db 102 6 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 1085 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1086 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1145 

Qy 1021 GGGAGAT T CAAGGAACAGAAGT CT C CT GAT T C CAC CT GGAC AC CAGT T C CTGATGAACGA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1146 GGGAGATT CAAG GAACAGAAGT CT C CT GAT TC CAC CT GGAC AC CAGT T C CT GATGAACGA 1205 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1206 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 12 65 

Qy 1141 T CCAAT GAGTTCCCT GAT GATACCCT GAACTT CAT CAAGACGCAC CCGCT CAT GGAT GAG 12 00 

I I I I II I I I I I I II I I I I I I I I I I I I I I 1 I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1266 T CCAAT GAGTTCCCT GAT GATACCCT GAACTTCATCAAGACGCACCCGCT CAT GGAT GAG 1325 

Qy 1201 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 12 60 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 132 6 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 138 5 

Qy 1261 AC CAAAAT T GCAGT G GAC ACAGCT GCT GGGCCAT AT CAGAAT CAC ACT GT GGT T T TT CT G 132 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138 6 AC CAAAAT T GCAGT G GACACAGCTGCT GGGCC ATAT CAGAAT C AC ACTGT GGT TT T T CT G 14 45 

Qy 1321 GGAT C AGAGAAGGGAAT CAT CTT GAAGT T T TT GGC CAGAAT AGGAAAT AGT GGTT T T CT A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 144 6 GGAT C AGAGAAG G GAAT CAT CTT GAAGT T T TT GGC CAGAAT AGGAAAT AGT GGTT T T CT A 15 05 

Qy 1381 AAT GACAGC CTT T T C CT G GAGGAGAT GAGT GT T T ACAACT CT GAAAAAT G CAGCT AT GAT 14 4 0 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1506 AAT GACAGC CTT T T C CT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT G CAGCT AT GAT 1565 

Qy 1441 GGAGT C GAAGACAAAAGGAT CAT GGGCAT GCAGCT G GAC AGAGCAAG CAG CT CT CT GTAT 15 00 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1566 GGAGT C GAAGACAAAAGGAT CAT GGGCAT GCAG CT GGAC AGAGCAAG CAGCT CT CT GTAT 1625 



Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 15 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 



Db 



1626 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1685 



Qy 1561 T GT AAAAAAAC CT GT AT T GC CT C CAGAGAC C CAT AT T GT GGAT GGAT AAAG GAAGGT G GT 1620 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I 

Db 1686 T GT AAAAAAAC CT GT AT T GC CT C CAGAGAC C CAT AT T GT G GAT GGAT AAAG GAAGGT GGT 1745 

Qy 1621 GCCT GC AGC CATT T AT CACC CAACAGC AGACT GACT T T T GAGCAG GACAT AGAGC GT GGC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I 

Db 1746 G CCT GC AGC CATT TAT CACC CAACAG C AGACT GACT TT T GAGCAG GACAT AGAGC GT GGC 1805 

Qy 1681 AAT ACAGATGGTCT GGGGGACTGT CACAATT CCTTT GT GGCACT GAAT GGGCATT CCAGT 1740 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 06 AAT ACAGAT GGTCT GGG GGACT GT CACAAT T CCT T T GT GG C ACT GAAT Q 1853 

Qy 1741 TCCCTCTTGCC CAGCAC AAC CACAT CAGAT T CGAC G GCT CAAGAGGGGTAT GAGT CT AGG 1800 

Db 1854 1853 

Qy 18 01 GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 1860 

Db 1854 1853 

Qy 18 61 GCAGT GT CT T C CCATAAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT TAC CT CAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1854 G GAGT GAT TC G GGAAAGT T AC CT CAAA 1880 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 18 81 GGC CACGACCAGCT GGT TCCCGTCACCCTCTTGGCCATT GCAGT CATC CTGGCTTTCGTC 194 0 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1941 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2000 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2 001 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2060 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2061 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 212 0 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 222 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2121 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 218 0 

Qy 2221 ATGCTCATTAAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCA 2280 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2181 AT GCT CAT TAAAGCAGAC CAGCAC CAC CT GGAC CT GACGGC C CT CC C CAC C CCAGAGT C A 224 0 

Qy 2281 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 234 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 2241 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 2300 

Qy 2341 C AGAAC CT C ATCAAT GC CT GCACAAAGGACAT GC CC C CC AT GGGCTCCCCTGT GAT T C C C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 2301 CAGAAC CT CAT CAAT GC CT GC ACAAAG GACAT G C C C C C CAT GGGCTCCCCTGT GAT T C C C 2360 



» 



Qy 

Db 



2401 
2361 



2460 
2420 



Qy 2461 AC GC AGC AGG G C T AC CAGCAT GAGT ACGT GGAC C AGC C CAAAAT GAGC GAG GT G G C CC AG 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2421 AC GC AGC AG G G C TAC CAGCAT GAGT AC GT GGAC C AG C C CAAAAT GAGC GAGGT GGC CCAG 2480 

Qy 2521 AT GGC GCT G GAGGAC CAGGCC G C CACAC T GGAGT ATAAGAC CAT CAAG GAAC AT CT CAG C 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 81 AT GGCGCT GGAGGACCAGGCCGC CACACT GGAGT AT AAGAC CATCAAGGAACATTT CAGC 2540 

Qy 2581 AGCAAGAGT C C CAAC CAT GGGGT GAACCT TGT G GAGAAC CT G GAC AGC CT GC C C C C CAAA 2640 

I II I I I I I I I I I I I I I I I I i I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2541 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 2 600 

Qy 2 641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I II I I I I I I I I I I I I I II 
Db 2601 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTTTCAGACCGGTTTA 2660 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2661 AGCAAGCGGCTGGAAATGCACCACTCCTTTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2720 

Qy 2761 C C CAC GAACT C GCT CAC GAGAAGC CACC AGGC CAC CACT CT CAAAAGAAACAACACT AAC 2820 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 
Db 2721 C C CAC GAACT C GCT CAC GAGAAGC CACC AGGC CAC CACT CT CAAAAGAAACAACACT AAC 27 80 

Qy 2821 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 2880 

I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I 
Db 2781 TCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCG 2840 

Qy 2881 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2940 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2841 CCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCC 2900 

Qy 2941 GT GACT GT C T C GAG GCAG C CCAG C CT CAACG C CTACAACT CACT GACAAGGT C GG GGCT G 3000 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2901 GTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTG 2960 

Qy 3001 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3060 

I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 29 61 AAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCC 3020 

Qy 3061 ACATC CAT GAAGCCCAAT GAT GCGT GTACATAA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3021 AC AT C CAT GAAG C C C AAT GAT GCGT GTACATAA 3053 



RESULT 9 
AAA93618 

ID AAA93618 standard; DNA; 3333 BP. 
XX 

AC AAA93618; 
XX 

DT 16-JAN-2001 (first entry) 



XX 

DE Human semaphorin protein-like splice variant SECX 2864933-2 DNA. 
XX 

KW SECX protein; human; secreted; membrane-associated; cancer; 

KW proliferation regulator; differentiation regulator; non-malignant tumour; 

KW immune disorder; autoimmune disease; transplant rejection; allergy; AIDS; 

KW infection; inflammatory disorder; arthritis; haematopoietic disorder; 

KW skin disorder; cardiovascular disorder; atherosclerosis; restenosis; 

KW neurological disease; Alzheimer ! s disease; trauma; wounding; 

KW spinal cord injury; skeletal disorder; cytostatic; immunosuppressive; 

KW anti-HIV; antiinflammatory; antiarthritic; antiarteriosclerotic; 

KW neuroprotective; vulnerary; antiallergic; antimicrobial; cardiant; 

KW dermatological; gene therapy; ds. 

XX 

OS Homo sapiens. 
XX 

PN WO200053742-A2. 
XX 

PD 14-SEP-2000. 
XX 

PF 09-MAR-2000; 2000WO-US006280 . 
XX 

PR 09-MAR-1999; 99US-0123667P . 

PR 08-MAR-2000; 2000US-052 07 8 IP . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Shimkets RA; 
XX 

DR WPI; 2000-594318/56. 

DR P-PSDB; AAB23031. 
XX 

PT Novel human membrane associated or secreted polypeptides and 

PT polynucleotides useful for diagnosis, prevention and treatment of 

PT pathological states such as cancer, immune, cardiovascular and 

PT neurological disorders. 

XX 

PS Claim 3; Fig 3; 151pp; English. 
XX 

CC Sequences AAA93616-A93631 and AAA93673-A93676 represent nucleic acids 

CC which encode human SECX proteins (AAB23029-B23048 ) . The SECX proteins of 

CC the invention are either secreted or membrane-associated proteins and act 

CC as regulator of cellular proliferation and differentiation. SECX proteins 

CC or nucleotides are useful for diagnosing the presence of, or 

CC predisposition to, a disease associated with altered levels of SECX 

CC proteins and nucleotides. The SECX proteins are also useful to screen 

CC compounds that modulate SECX activity or expression. The interaction of a 

CC SECX protein with other cellular proteins may be useful to modulate the 

CC activity of a partner protein, cellular proliferation, cellular 

CC differentiation and cell survival. SECX nucleotides are useful for the 

CC recombinant expression of SECX protein, and may be used detect SECX mRNA 

CC or genetic lesions in the SECX gene. They may also be used to modulate 

CC SECX expression (e.g., using antisense oligonucleotides). SECX nucleic 

CC acid sequences are also useful for identifying a cell or tissue type in a 

CC biological sample, and in forensic biology. SECX primers or probes are 

CC useful for detecting the presence of SECX nucleotides and for screening 

CC tissue cultures for contamination. Diseases that may be treated or 



CC prevented using SECX proteins or nucleotides include cancer (e.g., 

CC colorectal carcinoma, prostate cancer) , benign tumours, immune disorders 

CC (including autoimmune diseases, transplant rejection, allergies, AIDS) , 

CC infections, inflammatory disorders, arthritis, haematopoietic disorders, 

CC skin disorders, cardiovascular disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g., Alzheimer's disease), trauma (e.g., surgical 

CC or traumatic wounds, spinal cord injury), and skeletal disorders 
XX 

SQ Sequence 3333 BP; 874 A; 921 C; 845 G; 692 T; 0 U; 1 Other; 

Query Match 87.2%; Score 2698; DB 3; Length 3333; 

Best Local Similarity 93.9%; Pred. No. 0; 

Matches 2907; Conservative 0; Mismatches 21; Indels 167; Gaps 3; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I II I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

Qy 61 C C AGAAGAT T CT GAGC CAAT C AGT AT T T C G CAT GGCAACTAT ACAAAAC AGT AT C C GGT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 4 CCAGAAGATT CT GAGC CAAT CAGT ATT T CGCAT GGCAACTAT ACAAAACAGTATCCGGT G 333 

Qy 121 TTTGTGGGC CACAAG C CAGGAC GGAACAC CACACAGAGGCAC AGGCT GGACAT CC AGAT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 T TT GT GGGC CACAAGC CAG GAC GGAACAC CACACAGAG GCAC AGGCT GGACAT CC AGAT G 393 

Qy 181 AT TAT GAT CAT GAAC G GAACC CT C T ACAT T G CT GCT AGGGAC CAT AT T TAT ACT GT T GAT 240 

I I I I I I I I I II I I I I I I I I I I I I I I I II I I II I I I I I I I II I I I I I I I I I M I I I I I I I I 
Db 394 AT TAT GAT CAT GAAC GGAACC CT CT ACAT T GCT GCT AGGGAC CAT AT T TAT ACT GT T GAT 453 

Qy 241 ATAGACACATCACACACGGAAGAAATTTATT GTAGCAAAAAACTGACAT GGAAAT CTAGA 300 

I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 AT AGAC AC AT C AC AC AC GGAAGAAAT T TAT T GT AGC AAAAAAC T GAC AT GGAAAT CTAGA 513 

Qy 301 CAGGCCGAT GT AGAC ACAT GCAGAATGAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M 
Db 514 CAGGC C GAT GT AGACAC AT GC AGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACT T T 57 3 

Qy 361 AT TAAAGT T CT T CTAAAGAAAAAC GAT GAT GCATT GTT T GT CT GT G GAACT AAT GC CT T C 420 

I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 AT TAAAGT T CTT CTAAAGAAAAAC GAT GAT GCATT GTT T GT CT GT G GAACT AAT GC CT T C 633 

Qy 421 AACCCTT CCTGCAGAAACTATAAGAT GGATACATT GGAACCATT CGGGGAT GAATT CAGC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I II I I I 

Db 634 AACCCTT CCTGCAGAAACTATAAGAT GGATACATT GGAACCAT T CGGGGAT GAATT CAGC 693 

Qy 481 GGAAT GG C CAG AT GC CC AT AT GAT GCCAAACAT GC CAAC GT T GC ACT GT TT GC AG AT GGA 54 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 694 G GAAT GGC CAGAT GC CC AT AT GAT GCCAAACAT GC CAAC GT T GC ACT GT TT G CAGAT GGA 753 

Qy 541 AAACT AT ACT C AGC CAC AGT GACT GACT T C CT T G C CAT T GAC GCAGT C ATT T AC C GGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 AAACT AT ACT C AG CCAC AGT GACT GACTT C CT T GC CAT T GAC GCAGT CATT TAC C GGAGT 813 

Qy 601 CTT GGAGAAAGC C CTAC C CT G C G GACC GT CAAGC AC GAT T CAAAAT GGT TGAAAGAAC CA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I II I I I I I I I I 

Db 814 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 873 



Qy 


661 


TACT T T GT T CAAGC C GT G GAT T AC GGAGAT TAT AT CT ACT T CTT CT T CAGG GAAATAGC A 


720 




1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 

JllllllllllJIIIIIIIIIItllllLllllllllllllJiiiir 111111 ' 1 '* 11 




Db 


874 


T ACT TT GT T CAAGC C GT G GAT T AC GGAGAT TAT AT CTACT T CT T CT T CAGGGAAATAGC A 


933 


Qy 


721 


GT GGAGT AT AAC AC CAT G GGAAAG GTAGT T TT C C CAAGAGT G GCT C AGGT T T GT AAGAAT 


780 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 
i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i t i i i i * i i i i i i i i i • > i ■ i ■ i ' ■ ' ■ 




Db 


934 


GT GGAGT AT AACAC CAT GGGAAAGGTAGTTTT CCCAAGAGT GGCT CAGGTTT GT AAGAAT 


993 


Qy 


781 


GAT AT GG GAGGAT CT CAAAGAGT C CT GGAGAAACAGT G GAC GT C GT T C CT GAAGGC GC G C 


840 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i 1 f i i i i i i i i i i i i i i i i • i i i i i i i i i i i * ■ 




Db 


994 


GAT AT GGGAGGAT CT CAAAGAGTC CT GGAGAAACAGT GGAC GT C GT T C CT GAAG GC GC GC 


1053 


Qy 


841 


TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 


900 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 II 1 1 1 1 1 t 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1054 


TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 


1113 


Qy 


901 


GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


960 




1 i 1 1 1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

I 1 M I 1 I I I M II II 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 M 1 1 1 1 1 M II 1 1 II 1 1 1 1 1 I 1 l l l l l l 




Db 


1114 


GAT GT GAT T C GT AT CAAC GG GC GT GAT GT T GT CCT GGCAAC GTT T T CT ACAC CT TAT AAC 


1173 


Qy 


961 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1020 




1 1 II 1 1 1 1 1 1 1 1 1 1 E 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
I i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i t i i i ■ i i ■ i i i i 




Db 


1174 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1233 


Qy 


1021 


GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT CCT GAT GAACGA 


1080 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


1234 


GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT CCT GAT GAACGA 


1293 


Qy 


1081 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1140 




1 1 1 1 1 1 1 1 1 I 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 M 1 1 l l l l l l I I I I I I I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i M i i i i i i i 




Db 


1294 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1353 


Qy 


1141 


T CCAATGAGTT CC CTGAT GATACCCTGAACTTCAT CAAGACGCAC CCGCT CAT GGAT GAG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i 




Db 


1354 


T C CAAT GAGT T CC CTGAT GAT AC CCT GAACT T CAT CAAGAC GC AC CCGCT CAT GGAT GAG 


1413 


Qy 


1201 


GC AGT GC CCT C CAT CT T CAACAGGCCAT GGT T C CT GAGAACAAT G GT CAGAT AC C GC CTT 


1260 




1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 II 1 I II 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 I 1 II 1 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i ■ ■ i ■ i i i ■ ■ ■ i i >■ ■ 




Db 


1414 


GC AGT GC C CT C CAT CT T CAACAGGC C AT GGT TC CT GAGAACAAT GGT CAGAT AC C GC CTT 


1473 


Qy 


1261 


AC CAAAATT GCAGT GG ACAC AGCT GCT GGG C CAT AT C AGAAT C ACACT GTGGTTTTTCTG 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i ] i i i i i i i i i i i i i i i 1 i i i i i i i i i i i i i ■ i ■ < i i i * ■ ■ < > > ■ 




Db 


1474 


AC CAAAATT G CAGT GGACAC AGCT GCT GGGC CAT AT CAGAAT CAC AC TGTGGTTTTTCTG 


1533 


Qy 


1321 


GGAT C AGAGAAG GGAAT CAT CT T GAAGT T T T T GGCC AGAAT AG GAAAT AGT GGT TT T CT A 


1380 




1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | [ | | I I I I I I 1 1 1 1 ] 1 1 1 1 1 1 1 ) 1 1 1 1 1 1 1 1 1 1 1 1 1 ■ 1 1 1 > 1 1 ' ■ 1 1 1 




Db 


1534 


GGAT CAGAGAAGGGAAT CAT CT T GAAGT T T T T GGCCAGAATAGGAAAT AGT GGT TT T CT A 


1593 


Qy 


1381 


AAT GAC AGC C TT T T C C T GGAGGAGAT GAGT GTT TACAACT CT GAAAAAT GC AG CT AT GAT 


1440 




1 | M | I M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1594 


AAT GACAGC CTT T TC CT GGAGGAGAT GAGT GTT TACAACT CT GAAAAAT GCAGCTAT GAT 


1653 


Qy 


1441 


GGAGT C GAAGACAAAAGGAT CAT GG GCAT G CAGCT G GAC AGAGCAAG CAG CT CT CT GT AT 


1500 




|| | | | | | | | || M 1 1 1 1 1 1 M 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1654 


GGAGT C GAAGACAAAAGGAT CAT GGGCAT GCAG CT GGAC AGAG CAAGCAGCT CT CT GT AT 


1713 



Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M 
Db 1714 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1773 

Qy 1561 T GTAAAAAAAC CT GT AT T GC CT C C AGAGAC C CAT ATT GT GGAT G GAT AAAGGAAGGT GGT 162 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 1774 T GTAAAAAAAC CT GT AT T GC CT C CAGAGAC C CAT ATT GT G GAT G GAT AAAGGAAGGT G GT 1833 

Qy 1621 GCCT GCAGCCATT TAT CAC CCAACAGCAGACTGACTTT TGAGCAGGACAT AGAGCGT GGC 1680 

I I M I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1834 GCCT GCAGCCATT TAT CAC C CAACAGCAGACT GACT TT TGAGCAGGACAT AGAGC GT GGC 1893 

Qy 1681 AATACAGAT GGTCT GGGGGACTGT CACAAT T CCTTT GT GGCACT GAAT GGGCATT CCAGT 174 0 

I I I II II I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I 
Db 18 94 AATACAGAT GGTCT GGGGGACTGT CACAAT T CCTTT GT GGCACT GAAT 1941 

Qy 1741 T C C CT CT T GC CCAGC ACAAC CACAT CAGAT T CGAC G GC T CAAGAGGGGTAT GAGT CT AGG 1800 

Db 1942 1941 

Qy 18 01 GGAGGAAT GCT GGACT G GAAGCAT CT G CT T GACT CAC CT GACAG CAC AGAC CCT T T G GGG 1860 

Db 1942 1941 

Qy 1861 GC AGT GT CT T C C C AT AAT CAC CAAGAC AAGAAG GGAGT GAT T C G G GAAAGT T AC CT C AAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1942 GGAGT GAT T C GGGAAAGT T AC CT C AAA 1968 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I II I I I II I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1969 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2028 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 204 0 

I M | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2 029 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2088 

Qy 2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 
Db 2 089 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 214 8 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 9 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 22 08 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2209 GC CAT C CT CAC GC CACT CAT GC ACAAC G G CAAGCT C G C CACT C CC GGCAACAC GGC CAAG 2268 

Qy 2221 AT GCT CAT T AAAGCAGAC CAGCACCAC CT GGAC CT GAC GG C C CT C C C C AC CC C AGAGT C A 2280 

I II I M I I I I M I I I I I I I I I I I I I I 11 I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2269 AT GCT CAT T AAAGCAGAC CAGC AC CAC CT G GAC CT GAC GGC C CT C C C C AC CC CAGAGT CA 2328 

Qy 2281 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 2340 

I M II I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2329 AC CC CAAC G CT GCAGCAGAAGCG G GAAC C CAGC CG C GG CAC C C GC GAGT GGGAGAG GAAC 2388 

Qy 2341 C AGAAC CT CAT CAAT GC CT GC ACAAAGGACAT GCC C CC CAT GG GCT CC C CT GT GAT T C C C 24 00 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2389 CAGAAC CT C ATCAAT GC CT GCACAAAGGAC AT GC CC C CC AT GGGCTCCCCTGT GAT T C C C 24 4 8 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2460 

I I I I I I II I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2449 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2508 

Qy 2461 ACGCAGCAGGGCTACCAGCATGAGTACGT GGAC CAGCCCAAAAT GAGCGAGGT GGCC CAG 252 0 

I I I I I I I I I I I I I M I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2509 AC GCAG C AGGGCT AC CAGC AT GAGT AC GT GGAC CAGC CCAAAAT GAGCGAGGT GGCC CAG 2568 

Qy 2521 AT G G CGC TGGAG GAC CAGGC CGC C AC ACT GGAGTAT AAGAC CAT CAAGGAACAT CT CAGC 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2569 ATGGCGCTGGAGGAC CAGGC CGCCACACT GGAGTATAAGACCAT CAAGGAACAT CTCAGC 262 8 

Qy 2581 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 264 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2 629 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 268 8 

Qy 2 641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2689 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 48 

Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I ! I I I I I I I I I I I I I I I I I I 
Db 2749 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 28 08 

Qy 2761 CC C ACGAACT CG CT CAC GAGAAGC CAC CAGG C C ACC - ACT CT CAAAAGAAACAACACT AA 2819 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I 

Db 2 809 CCCACGAACT CGCT CAC GAGAAGC CAC CT GACCACCTACT CTCATCAGAAGCAACACTAA 28 68 

Qy 2820 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 28 7 8 

III I I I I I I III II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2869 CCCCGACAATTCANCTCTGACTTCAAAGGGACCAGAGCTTTGGCAGGGGAGACAACCCGC 292 8 

Qy 2879 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2938 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 2 929 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 298 8 

Qy 2939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 2 989 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 304 8 

Qy 2999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3049 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCC7WVCCATCCTTTGCTCCCCTTT 3108 

Qy 3059 CCACAT CCAT GAAGCCCAAT GAT GCGTGT ACATAA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3109 C C ACAT C CAT GAAGC C CAAT GAT GC GT GT ACATAA 314 3 



RESULT 10 
ADA23282 

ID ADA23282 standard; cDNA; 3333 BP. 
XX 

AC ADA2 3282; 



XX 

DT 20-NOV-2003 (first entry) 
XX 

DE cDNA encoding human SECX polypeptide, SEC3 #1. 
XX 

KW Human; secreted polypeptide; membrane-associated polypeptide; SECX; SECl; 

KW SEC2; SEC3; SEC4; SEC5; SEC6; SEC7; SEC8; SEC9; SEC10; SEC11; SEC12; 

KW SEC13; SEC14; SEC15; SECX-as sociated disorder; lung cancer; 

KW cardiovascular disease; oncology disease; immune disorder; 

KW autoimmune disease; transplant rejection; allergy; AIDS; infections; 

KW inflammatory disorder; arthritis; haematopoietic disorder; skin disorder; 

KW atherosclerosis; restenosis; neurological disease; Alzheimer's disease; 

KW trauma; wounds; spinal cord injury; skeletal disorder; cytostatic; 

KW antiinflammatory; immunosuppressive; anti-HIV; antiarthritic; 

KW antiarteriosclerotic; cardiant; neuroprotective; nootropic; vulnerary; 

KW antiallergic; cardiant; dermatological ; gene; ss. 

XX 

OS Homo sapiens . 
XX 

PN US2003054514-A1. 
XX 

PD 20-MAR-2003. 
XX 

PF 19-SEP-2001; 2001US-00957187 . 
XX 

PR 09-MAR-1999; 99US- 0123667P . 

PR 04-JAN-2000; 2 000US- 0174 4 85P . 

PR 08-MAR-2000; 2 000US- 0052078 1 . 

PR 19-SEP-2000; 2 000US- 02337 98P . 

PR 20-SEP-2000; 2 000US-0234082P . 
XX 

PA (SHIM/) SHIMKETS R A. 

PA (LARO/) LAROCHELLE W J. 
XX 

PI Shimkets RA, Larochelle WJ; 
XX 

DR WPI; 2003-540616/51. 

DR P-PSDB; ADA23283. 
XX 

PT New SECX nucleic acids, useful for treating or diagnosing a disorder 

PT e.g., lung cancer, cardiovascular and oncology diseases, immune disorder, 

PT and autoimmune disease. 

XX 

PS Claim 3; Fig 3; 118pp; English. 
XX 

CC The present invention relates to the isolation of human secreted or 

CC membrane-associated (SECX) polypeptides designated SEC1-SEC15, and the 

CC polynucleotide sequences encoding them. Also disclosed is a method for 

CC screening for a modulator of activity or latency of SECX. The SECX 

CC polypeptide and polynucleotide sequences may be used for treating or 

CC preventing SECX-associated disorders such as lung cancer, cardiovascular 

CC and oncology diseases, immune disorders, autoimmune diseases, transplant 

CC rejection, allergy, AIDS, infections, inflammatory disorders, arthritis, 

CC haematopoietic disorders, skin disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g. Alzheimer f s disease), trauma, wounds, spinal 

CC cord injuries, and skeletal disorders. The present sequence encodes a 

CC SECX polypeptide of the invention. 



SQ Sequence 3333 BP; 874 A; 921 C; 845 G; 692 T; 0 U; 1 Other; 



Query Match 87.2%; Score 2698; DB 8; Length 3333; 

Best Local Similarity 93.9%; Pred. No. 0; 

Matches 2907; Conservative 0; Mismatches 21; Indels 167; Gaps 3; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

Qy 61 CCAGAAGATT CTGAGCCAAT CAGTATTT CGCAT GGCAACTATACAAAACAGTAT CCGGTG 120 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 274 CCAGAAGATTCTGAGCCAAT CAGTATTT CGCAT GGCAACTATACAAAACAGTAT CCGGTG 333 

Qy 121 T TT GT GGGC C ACAAGC CAG GACG GAAC AC CACAC AGAGGC ACAGGCT GGACAT C C AGATG 180 

I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 
Db 334 TTT GTGGGC CACAAGC CAGGACGGAACACCACACAGAGGCACAGGCTGGACAT CCAGATG 393 

Qy 181 ATTATGAT CAT GAACGGAAC C CTCTACATT GCTGCTAGGGACCATATTTATACT GTT GAT 240 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ATTATGAT CAT GAACGGAAC C CT CTACATT GCTGCTAGGGACCATATTTATACT GTT GAT 453 

Qy 241 ATAGAC ACAT CAC ACAC GGAAGAAATT T AT T GTAGCAAAAAACT GACAT G GAAAT CT AGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 54 ATAGAC ACAT CAC ACAC GGAAGAAATT TAT T GTAGCAAAAAACT GACAT G GAAAT CT AGA 513 

Qy 301 CAGGCC GAT GTAGACACATG CAGAAT GAAG GGAAAAC ATAAGGAT GAGT G C CACAACT T T 360 

I I I I I I I I I I II I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 CAGGCC GAT GTAGACACATG CAGAAT GAAGGGAAAAC ATAAGGAT GAGT GC CACAACT T T 573 

Qy 361 ATTAAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACTAAT GCCT T C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 
Db 574 ATT AAAGTT CT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACTAAT GCCT T C 633 

Qy 421 AAC C CT T CCT GCAGAAACTATAAGAT GGAT ACAT T GGAAC CAT T C G GGGAT GAAT T CAGC 4 80 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 634 AAC C CT T CCT GCAGAAACTATAAGAT GGAT ACAT T GGAAC CAT T C G GGGAT GAAT T CAGC 693 

Qy 481 GGAAT GGCCAGAT GCC CAT AT GAT GC CAAACAT GC CAACGT T GC ACT GT T T GCAGAT GGA 54 0 

II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 GGAAT GGCCAGAT GCC CAT AT GAT GC CAAACAT GC CAACGT T GC ACT GT T T GCAGAT GGA 753 

Qy 541 AAACT AT AC T CAG C CACAGT GACT GACTT C CT T GC CAT T GAC GC AGT CAT T T AC C GGAGT 600 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I E II I I I I I I I I I I I I I I 
Db 754 AAACTAT AC T CAGC CACAGT GACT GACT T C CT T GC CAT T GAC GC AGT CAT T TAC C GGAGT 813 

Qy 601 CTT G GAGAAAG C C CT AC CCT GCGGAC CGT CAAG C AC GATT CAAAAT GGTT GAAAGAAC CA 660 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 814 CTT G GAGAAAGC C CT AC C CT GCGGAC C GT CAAGCACGATT CAAAAT GGTT GAAAGAAC CA 873 

Qy 661 TACT TT GTT CAAGC CGT GGATTACGGAGATTATAT CT ACTT CTT CTT CAGGGAAATAGCA 720 

I I II I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I II I I I I I I I I 
Db 874 TACTTT GTT CAAGCCGT GGATTAC GGAGATTATAT CT ACTT CTT CTT CAGGGAAATAGCA 933 

Qy 721 GT G GAGT ATAACAC CAT G GGAAAG GT AGTT T T C C CAAGAGT GG CT CAGGT T T GTAAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 



Db 934 GTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAAT 993 

Qy 7 81 GAT AT GGGAGGAT CT CAAAGAGT C CT G GAGAAAC AGT GGAC GT C GT T C CT GAAGGC G C GC 840 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 GAT AT GGGAGGAT CTCAAAGAGT C CT GGAGAAAC AGT G GAC GT C GTT C CT GAAGG C GC GC 1053 

Qy 841 T T GAAC T G C T CAGT T C CT GGAGACT CT CAT T T TT ATT T C AACAT T CT C CAGGC AGTT ACA 900 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | M | 

Db 1054 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 1113 

Qy 901 GAT GTGAT T C GT AT CAAC GGG C GT GAT GTT GT C CT G G C AAC GTT T TCT AC AC CT TAT AAC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 
Db 1114 GAT GT GAT T C GT AT CAAC GGGC GT GAT GTT GT C C T GGCAAC GT T T T C T AC AC C T TAT AAC 1173 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1174 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1233 

Qy 1021 GGGAGATT CAAGGAACAGAAGT CT CCT GAT T CCACCTGGACACCAGTT CCT GAT GAAC GA 1080 

II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1234 GGGAGAT T CAAGGAACAGAAGT CT C CT GAT T C CAC CT GGACAC CAGT T CCT GAT GAAC GA 1293 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I M I I I I I II I I I I I I I I II I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I 
Db 12 94 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1353 

Qy 1141 T CCAATGAGTT CCCTGAT GAT AC CCTGAACTTCAT CAAGACGCAC CCGCT CATGGAT GAG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1354 T CCAAT GAGT T CC CT GAT GAT AC C CT GAAC T T CAT CAAGAC GCAC C C GCT C AT G GAT GAG 1413 

Qy 1201 G CAGTGC C CT C CAT CTT CAACAGGC CAT GGT T C CT GAGAACAAT GGT C AGAT AC C GC CT T 1260 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 1414 G CAGTGC C CT C CAT CTT CAACAGG C CAT GGT T CCT GAGAACAAT GGT CAGAT AC C GC CT T 1473 

Qy 1261 ACCAAAAT T GCAGT GGACACAGCT GCT GGG C CAT AT C AGAAT CAC ACT GT GGTT T TT CT G 1320 

I I i I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1474 ACCAAAAT T GCAGT GGACACAGCT GCT GGG CCAT AT C AGAAT CAC ACT GTGGTTTTTCT G 1533 

Qy 1321 G GAT CAGAGAAGGGAAT CAT CTT GAAGT T T TT GG C CAGAATAGGAAAT AGT G GT T T T CT A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1534 G GAT CAGAGAAGGGAAT CAT C TT GAAGT T T TT GG C CAGAATAGGAAAT AGT G GT T T T CT A 1593 

Qy 1381 AAT GACAGCCTTTTCCT GGAGGAGATGAGT GTTTACAACT CTGAAAAATGC AGCTAT GAT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1594 AAT GACAGCCTTTTCCT GGAGGAGATGAGT GTTTACAACT CTGAAAAATGCAGCTAT GAT 1653 

Qy 1441 G GAGT C GAAGACAAAAGGAT C AT GGGC AT GC AGC T GGAC AGAGC AAGC AGCT CT CT GT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1654 G GAGT C GAAGACAAAAGGAT CAT GGGC AT GC AGC T GGACAGAGCAAGC AGC T CT CT GT AT 1713 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1714 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1773 

Qy 1561 T GT AAAAAAACCT GT AT T GCCT C CAGAGAC C CAT ATT GT GGATG GAT AAAGGAAGGT GGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I II I I I I 
Db 1774 T GT AAAAAAAC CT GT AT T GC CT C CAGAGAC C CAT ATT GT GGATGGAT AAAGGAAGGT GGT 1833 



Qy 1621 GC CT GC AGC CATT TAT CAC C CAACAGCAGACT GACT T TT GAGC AGGACATAGAGC GT GGC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I 
Db 1834 G C CT GCAG C CATT TAT CAC C CAACAGCAGACT GAC T T TT GAGCAG GACAT AGAGCGT GGC 18 93 

Qy 1681 AAT AC AGAT GGT C T G GGG GACT GT CACAATT C C T TT GT GG CACT GAATGGGC AT T C CAGT 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1894 AAT AC AGAT GGT CT G GGG GACT GT CACAAT T C C T TT GT GG CACT GAAT 1941 

Qy 1741 TCCCTCTTGCC C AGCACAAC CAC AT C AGAT T C GAC G GCT CAAGAGGGGT AT GAGT CT AGG 1800 

Db 1942 1941 

Qy 1801 GGAGGAAT GCT GGAC T G GAAGC AT C T G CT T GACT CAC CT GAC AGCACAGACC CTTT G GGG 18 60 

Db 1942 1941 

Qy 1861 GCAGT GT CTT CCCATAATCACCAAGACAAGAAGGGAGTGATT CGGGAAAGTTACCT CAAA 192 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1942 G GAGT GATT C GGGAAAGT T AC CT CAAA 1968 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 198 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1969 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2028 

Qy 1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2 02 9 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 208 8 

Qy 2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2089 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 214 8 

Qy 2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 9 AGC GT CAC CAAGCT C AGC GG CCT CTTT GG GGAC ACT CAAT CCAAAGACC CAAAGCC GGAG 22 08 

Qy 2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2209 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 22 68 

Qy 2221 ATGCTCATTAAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 69 AT GCT CAT TAAAGCAGAC CAGCACC AC CT GGAC CT GACG GCC CT C C C CAC CC CAGAGT CA 232 8 

Qy 2281 ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 2340 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 232 9 ACCCCAACGCTGCAGCAGAAGCGGGAACCCAGCCGCGGCACCCGCGAGTGGGAGAGGAAC 238 8 

Qy 2341 CAGAAC CT CAT CAAT GCCT G CACAAAGGACAT GC C C C C CAT GGGCTCCCCTGT GAT T C C C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 238 9 CAGAACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 24 48 

Qy 2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 244 9 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2508 



Qy 2461 ACGCAGCAGGGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAG 2520 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I ! I I I I I I I I I I 

Db 2509 AC GCAGCAGGGCT AC CAGCAT GAGT ACGT GGACCAGCC CAAAAT GAGC GAGGT GGCCCAG 2568 

Qy 2521 AT GG C GC T GGAGGAC C AG GC C GC C ACACT GGAGT AT AAGAC CAT CAAG GAACAT CT C AGC 2580 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2569 AT GG C GCT GGAGGAC C AG GC C GC CACACT GGAGT AT AAGAC CAT CAAGGAACAT CT C AGC 262 8 

Qy 2581 AGCAAGAGT C C CAAC CAT GG GGT GAAC CTT GT GGAGAACC T GGAC AG C CT GC CC CC CAAA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 629 AGCAAGAGT C C CAAC CAT GGGGT GAAC CTT GT G GAGAACC T GGACAG C CT GC CC CC CAAA 268 8 

Qy 2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 689 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 274 8 

Qy 27 01 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 27 60 

II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2749 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 28 08 

Qy 2761 C CCAC GAACT C GCT CAC GAGAAGC CAC CAGG C C AC C - ACT C T CAAAAGAAACAACACT AA 2 819 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I II 
Db 2809 CCCACGAACT CGCT CACGAGAAGCCAC CTGACCACCTACT CT CAT CAGAAGCAACACTAA 2868 

Qy 2 820 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 2 87 8 

III I I I I I I III II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2 869 CCCCGACAATTCANCTCTGACTTCAAAGGGACCAGAGCTTTGGCAGGGGAGACAACCCGC 292 8 

Qy 2 879 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2938 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 1 II I I I I I I I I I I I I I I I I I I I M I 
Db 2 929 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 298 8 

Qy 2 939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2989 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3048 

Qy 2 999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3 049 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3108 

Qy 3059 CCACAT C CAT GAAGCCCAATGATGCGT GTACATAA 3093 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 3109 C CAC AT C CAT GAAGC C C AAT GAT G C GT GTACATAA 3143 



RESULT 11 
AAS68807 

ID AAS68807 standard; cDNA; 3039 BP. 
XX 

AC AAS68807; 
XX 

DT 13-FEB-2002 (first entry) 
XX 

DE DNA encoding novel human diagnostic protein #4611. 
XX 

KW Human; chromosome mapping; gene mapping; gene therapy; forensic; 
KW food supplement; medical imaging; diagnostic; genetic disorder; ss. 



XX 

OS Homo sapiens . 
XX 

PN WO200175067-A2. 
XX 

PD ll-OCT-2001. 
XX 

PF 30-MAR-2 001; 2001WO-US008631 . 
XX 

PR 31-MAR-2000; 2000US-0054 02 17 . 

PR 23-AUG-2000; 2000US-0064 9167 . 
XX 

PA (HYSE-) HYSEQ INC. 
XX 

PI Drmanac RT, Liu C, Tang YT; 
XX 

DR WPI; 2001-639362/73. 

DR P-PSDB; ABG04620. 
XX 

PT New isolated polynucleotide and encoded polypeptides, useful in 

PT diagnostics, forensics, gene mapping, identification of mutations 

PT responsible for genetic disorders or other traits and to assess 

PT biodiversity. 
XX 

PS Claim 1; SEQ ID NO 4611; 103pp; English. 
XX 

CC The invention relates to isolated polynucleotide (I) and polypeptide (II) 

CC sequences. (I) is useful as hybridisation probes, polymerase chain 

CC reaction (PCR) primers, oligomers, and for chromosome and gene mapping, 

CC and in recombinant production of (II) . The polynucleotides are also used 

CC in diagnostics as expressed sequence tags for identifying expressed 

CC genes. (I) is useful in gene therapy techniques to restore normal 

CC activity of (II) or to treat disease states involving (II). (II) is 

CC useful for generating antibodies against it, detecting or quantitating a 

CC polypeptide in tissue, as molecular weight markers and as a food 

CC supplement. (II) and its binding partners are useful in medical imaging 

CC of sites expressing (II) . (I) and (II) are useful for treating disorders 

CC involving aberrant protein expression or biological activity. The 

CC polypeptide and polynucleotide sequences have applications in 

CC diagnostics, forensics, gene mapping, identification of mutations 

CC responsible for genetic disorders or other traits to assess biodiversity 

CC and to produce other types of data and products dependent on DNA and 

CC amino acid sequences. AAS64197-AAS94564 represent novel human diagnostic 

CC coding sequences of the invention. Note: The sequence data for this 

CC patent did not appear in the printed specification, but was obtained in 

CC electronic format directly from WIPO at 

CC f tp. wipo. int/pub/published_pct_sequences 

XX 

SQ Sequence 3039 BP; 741 A; 869 C; 781 G; 648 T; 0 U; 0 Other; 



Query Match 71.8%; Score 2221.8; DB 5; Length 3039; 

Best Local Similarity 91.2%; Pred. No. 0; 

Matches 24 08; Conservative 0; Mismatches 167; Indels 66; Gaps 2; 

Qy 519 C GT T GCACT GT T T G C AGAT GGAAAACT AT ACT CAG C CAC AGT GACT GACT T C CTT G CCAT 578 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 
Db 39 9 CCTGACTCTGTCTCCAGATGGAAAACTATACTCAGCCACAGTGACTGACTTCCTTGCCAT 458 



Qy 57 9 T GAC G C AGTCAT T T AC C GGAGT CT T GGAGAAAGC C CT ACC CT GC GGAC C GT CAAGC ACGA 638 

I I I II I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 59 T GAC GC AGTCAT T TACC GGAGT CT T GGAGAAAGC C CT AC C CT GC GGAC C GT CAAG CAC GA 518 

Qy 639 T T CAAAAT GGT T GAAAGAAC CAT ACTT T GT T CAAGCC GT G GATT AC GGAGAT TAT AT CTA 698 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 519 TTCAAAAT GGTT GAAAGAAC CAT ACTTT GTT CAAGCC GTGGATTACGGAGATTAT AT CTA 578 

Qy 69 9 CTT CT T CT TCAGGGAAATAGCAGT GGAGT AT AACACCATGGGAAAGGTAGTTTT C CCAAG 758 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 
Db 57 9 CTTCTTCTT C AGGGAAAT AGC AGT GGAGT AT AAC AC CAT G GGAAAGGT AGT T TT C CCAAG 638 

Qy 759 AGTGGCT CAGGTT T GTAAGAAT GAT AT GGGAGGATCT CAAAGAGT CCTGGAGAAACAGT G 818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 639 AGT GGCT CAGGTT T GTAAGAAT GAT AT GGGAGGAT CT CAAAGAGT CCTGGAGAAACAGT G 698 

Qy 819 GACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTT 87 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I I I I II II I I I I I I I I I 

Db 699 GACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTT 758 

Qy 879 CAAC AT T CT C CAGGCAGT TAC AGAT GT GAT T C GT AT CAAC G G G C GTGAT GT T GT C CT GGC 938 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 7 59 CAAC AT T CT C CAGGCAGT TAC AGAT GT GAT T CGT AT CAAC GG GC GT GAT GT T GT C CT GGC 818 

Qy 939 AACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCT 998 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 819 AAC GT T TT CT ACAC CT T AT AACAG CAT C CCT GGGT CT GCAGT C T GT GC CT AT GAC AT GCT 878 

Qy 999 T GAC AT T G C CAGT GT T T T TACT GGGAGATT CAAGGAACAGAAGT CTC CT GAT T C CAC CT G 1058 

I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I J I II I I I I I I I II I I I I I M I I I I I 

Db 879 T GAC AT T GC C AGT GT TTT TACT GGGAGATT CAAG GAACAGAAGT CT C CT GAT T C CAC CTG 938 

Qy 1059 GACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATC 1118 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 939 GACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATC 998 

Qy 1119 CTCCTT AGAAAGATAT GCAACCTCCAAT GAGTT CCCT GATGATACCCT GAACTT CAT CAA 1178 

I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I M I I M I I I I I I I I I I I I 

Db 999 CT C CTT AGAAAGATAT G CAAC CT C CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAA 1058 

Qy 1179 GACGCACCCGCTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAG 1238 

II II I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1059 GAC GCAC CC GCT CAT GGAT GAGGC AGT G CC CT C CAT CTT CAAC AG GC CAT G GT T C CT GAG 1118 

Qy 1239 AACAAT GGT C AGAT AC C GC C T TAC CAAAAT T GCAGT GGAC ACAGCT GCT GGGC C AT AT CA 1298 

I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I M 

Db 1119 AACAAT GGT C AGAT AC C GC CT TAC CAAAAT T GCAGT G GACACAGCT GCT GGGCC AT AT CA 1178 

Qy 1299 GAAT C ACACT GT GGTT T TT CT GGGAT C AGAGAAGGGAAT C AT CT T GAAGT T TT T GGC CAG 1358 

I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I II I I I I I M I I I I I I I I I I I 
Db 1179 GAAT C ACACT GTGGTTTTTCT GG GAT C AG AGAAG GGAAT C AT CT T GAAGT T TT T G GC CAG 1238 

Qy 1359 AAT AGGAAAT AGT G GT T T T CTAAAT GACAG CCTTTTCCTG GAGGAGAT GAGT GT T T ACAA 1418 

I I I I M I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1239 AAT AGGAAAT AGT GGT TTT CTAAAT GAC AGC CT T TT C CT GGAGGAGAT GAGT GT T T ACAA 12 98 



Qy 1419 CT CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT G GGCAT G CAG CT GGA 1478 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 99 CT CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAG GAT CAT G GGCAT GC AGCT G GA 1358 

Qy 14 79 CAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGG 1538 

I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1359 CAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGG 1418 

Qy 1539 C C GGT GT GAAC GAC AT GGGAAGT GT AAAAAAAC CT GT ATTGC CT C CAGAGAC C CAT AT T G 1598 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I 

Db 1419 C C GGT GT GAAC GAC AT G G GAAGT GT AAAAAAACCT GT AT TGC CT C CAGAGAC C CAT AT T G 1478 

Qy 1599 T GGAT GGAT AAAGGAAGGT GGT GC CT GC AGC CAT T TAT CAC C CAACAGCAG ACTG 1653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 147 9 T GGAT GGAT AAAGGAAGGT GGT GC CT GC AGC CAT T TAT CAC C C AACAGCAGGACACAGAG 1538 

Qy 1654 AC TT T T GAG C AGGAC AT AGAG C GT GGCAATAC AGAT GGT CT GGGGGACT GT C ACAATT C C 1713 

III III I I I I I I I I I 

Db 1539 AG GCT T T GT T GT CT T T GT G GT CAC C GGGT C CACT T T AC ACAGAT GC CT AT TAAT CACT T C 1598 

Qy 1714 T T T GT GGC ACT GAAT GGGCAT T C C AGTT C CCTCTTGCC CAGCACAAC CACAT CAGATT C G 1773 

I I I I I I I I I I I I I I I I III I 

Db 1599 ACTAT GGAGAC AGAC AC AT CC AT CAT AT CACAGCAGCT CAGAAACGGGCCGT CCAGTGAA 1658 

Qy 1774 AC G GCT C AAGAG GG GTAT GAG 1794 

III I I I I I I I I I I 

Db 1659 AGGGGGTGAGAGGGGAAAGTGCACACTTAACCATTTCGAGTTAGGTTACTGGTTGCCTGT 1718 

Qy 1795 T CT AGGGGAGGAATGCT GGACT GGAAGCAT CT GCTTGA 1832 

I I II II I I I I I III II I 

Db 1719 GTCTTACACGCTTAGGGTGGTAATTGGGGTGGGGTTGCTTAAAAGGCAAACACTTTTCCC 1778 

Qy 1833 CT CAC CT GAC AGCAC AGAC C CTTT GGGGG CAGT GT CT T C CCATAAT CAC CAAGACAAGAA 1892 

III I II I I I I I I I I I I 

Db 1779 C AGACGGAGGCT CC G GT GGC C ACAAGGGGGT C GT C GGAAAAGAT C C CAACT G GAAGCC CA 1838 

Qy 18 93 GGGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTT 1952 

I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1839 GAGAGT GAT T C GGGAAAGT T AC CT CAAAGGC CAC GAC C AGCT GGT T C C C GT CAC C CT CT T 1898 

Qy 1953 GGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTA 2 012 

I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1899 GGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTA 1958 

Qy 2013 CTGCGTCTGT GAT CATC GGC GCAAAGACGTG GCT GT GGT GCAGCGCAAGGAGAAGGAGCT 2072 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1959 CTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCT 2018 

Qy 2073 CACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGA 2132 

I I I I II I I I I II I I I I I I I I I I I I I i I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2019 CACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGA 2 078 

Qy 2133 C ACT CAAT C CAAAGAC C CAAAGC C GGAG G C CAT C CT CAC GC CACT CAT GCACAAC GG C AA 2192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 207 9 CACT CAAT C CAAAGAC C CAAAGC C G GAG GC CAT C CT CAC GC CACT CAT GCACAAC GG CAA 2138 



Qy 



2193 GCT C GC C ACT C CC GG CAACAC GG C CAAGAT G CT C ATT AAAGCAGACCAGCAC CAC CT GGA 2252 



Db 2139 G CT C GC CACT C CC GGCAAC AC GGC CAAGAT GCT CAT T AAAG CAGAC C AG CACC AC CT GGA 2198 

Qy 2253 C CT GAC GGC C CT C C CCAC C C CAGAGT CAAC C CCAAC GCTGC AGCAGAAG C GGAAG C C CAG 2312 

I I I I II II II I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2199 C CT GAC GGC C CT C C CC ACC C CAGAGT CAAC C CCAAC GCT GCAG CAGAAGC GGAAG C C CAG 2258 

Qy 2313 C C G C GG CAGC C G C GAGT GG GAGAGGAAC CAGAAC CT C ATCAAT GCC T GCACAAAGGACAT 2372 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 59 CCGCGGCAGC C GCGAGT GGGAGAGGAAC CAGAAC CT CATCAAT GCCT GCACAAAGGACAT 2318 

Qy 2373 GCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCA 2432 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2319 GCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCA 2378 

Qy 24 33 CATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGA 2492 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2379 CATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGA 2438 

Qy 24 93 CCAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGA 2552 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 

Db 2439 CCAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTGGAGGACCAGGCCGCCACACTGGA 24 98 

Qy 2553 GT AT AAGAC CAT CAAG GAACAT CT CAGCAGCAAGAGT C C CAAC CAT G GG GT GAAC CT T GT 2612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II 
Db 24 99 GT AT AAGAC CAT CAAGGAACAT CT CAG CAGCAAGAGT C C CAAC CAT GGGGT GAAC CT T GT 2558 

Qy 2613 GGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCC 2 672 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2559 GGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCC 2618 

Qy 2673 GGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTC 2732 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2619 GGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTC 2678 

Qy 2733 CTAC GGGGT T GACT ATAAGAGGAGCT ACC CCAC GAACT C GCT CACGAGAAGCCAC C AGGC 27 92 

I I I I I I I I I I I I I I I I II I I M I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I 
Db 2 679 CT AC GG GGT T GACT ATAAGAGGAGCT ACC C CAC GAACT C GCTC AC GAGAAGC CACC AGGC 2738 

Qy 2793 CAC CACT CTCAAAAGAAACAACACTAACTCCTCCAATTCCTCT CAC CTCTCCAGAAACCA 28 52 

M I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 CACCACTCTCAAAAGAAACAACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCA 27 98 

Qy 2853 GAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGT 2912 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2799 GAG CT T T GGC AGG GGAGACAAC C C G C C GC C CGC C CC GCAGAG GGT GGACT C CAT C C AGGT 28 58 

Qy 2913 GCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGC 2972 

I I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2859 GCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGC 2918 

Qy 2973 CTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCT7VAAGCCGGACGTACC 3032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2919 CTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACC 2978 

Qy 3033 C C C CAAAC CAT C CTT T GCTC C CCTT T C CAC AT C CAT GAAGCC CAAT GAT G CGT GTACAT A 3092 

I I I I I I I I I M I I I M I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 



Db 2979 CCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATGAAGCCCAATGATGCGTGTACATA 3038 

Qy 3093 A 3093 

I 

Db 3039 A 3039 
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AAS89721 

ID AAS89721 standard; cDNA; 3039 BP. 
XX 

AC AAS89721; 
XX 

DT 13-FEB-2002 (first entry) 
XX 

DE DNA encoding novel human diagnostic protein #25525. 
XX 

KW Human; chromosome mapping; gene mapping; gene therapy; forensic; 

KW food supplement; medical imaging; diagnostic; genetic disorder; ss. 
XX 

OS Homo sapiens. 
XX 

PN WO200175067-A2. 
XX 

PD ll-OCT-2001. 
XX 

PF 30-MAR-2001; 2001WO-US008631 . 
XX 

PR 31-MAR-2000; 2000US-00540217 . 

PR 23-AUG-2000; 2000US-00649167 . 
XX 

PA (HYSE-) HYSEQ INC. 
XX 

PI Drmanac RT, Liu C, Tang YT; 
XX 

DR WPI; 2001-639362/73. 

DR P-PSDB; ABG25534. 
XX 

PT New isolated polynucleotide and encoded polypeptides, useful in 

PT diagnostics, forensics, gene mapping, identification of mutations 

PT responsible for genetic disorders or other traits and to assess 

PT biodiversity. 
XX 

PS Claim 1; SEQ ID NO 25525; 103pp; English. 
XX 

CC The invention relates to isolated polynucleotide (I) and polypeptide (II) 

CC sequences. (I) is useful as hybridisation probes, polymerase chain 

CC reaction (PCR) primers, oligomers, and for chromosome and gene mapping, 

CC and in recombinant production of (II) . The polynucleotides are also used 

CC in diagnostics as expressed sequence tags for identifying expressed 

CC genes. (I) is useful in gene therapy techniques to restore normal 

CC activity of (II) or to treat disease states involving (II). (II) is 

CC useful for generating antibodies against it, detecting or quantitating a 

CC polypeptide in tissue, as molecular weight markers and as a food 

CC supplement. (II) and its binding partners are useful in medical imaging 

CC of sites expressing (II). (I) and (II) are useful for treating disorders 

CC involving aberrant protein expression or biological activity. The 



CC polypeptide and polynucleotide sequences have applications in 

CC diagnostics, forensics, gene mapping, identification of mutations 

CC responsible for genetic disorders or other traits to assess biodiversity 

CC and to produce other types of data and products dependent on DNA and 

CC amino acid sequences. AAS64197-AAS94564 represent novel human diagnostic 

CC coding sequences of the invention. Note: The sequence data for this 

CC patent did not appear in the printed specification, but was obtained in 

CC electronic format directly from WIPO at 

CC f tp . wipo . int/pub/published_pct_sequences 

XX 

SQ Sequence 3039 BP; 741 A; 869 C; 781 G; 648 T; 0 U; 0 Other; 



Query Match 71.8%; Score 2221.8; DB 5; Length 3039; 

Best Local Similarity 91.2%; _ Pred. No. 0; 

Matches 2408; Conservative 0; Mismatches 167; Indels 66; Gaps 2; 

Qy 519 CGTTGCACTGTTTGCAGATGGAAAACTATACTCAGCCACAGTGACTGACTTCCTTGCCAT 57 8 

I I I I I I I I II I I I I I I I I I I I 11 I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 399 CCT GACT CT GTCT CCAGAT GGAAAACTATACT CAGCCACAGTGACT GACTT CCTTGCCAT 458 

Qy 579 T GACGC AGT CAT T TAC C GGAGT CT T G GAGAAAGC C CT AC C CT GC G GACC GT CAAGCACGA 638 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 459 T GACGC AGT CAT T TAC C GGAGT CT T GGAGAAAGC C CT AC C CT G C GGACC GT CAAGCACGA 518 

Qy 639 TT CAAAAT G GTT GAAAGAAC CAT ACT T T GT T CAAGCC GT GGAT TAC GGAGAT TAT AT CT A 698 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 519 TT CAAAAT GGTT GAAAGAAC C AT ACT TT GT T CAAGCC GT G GAT TAC GGAGAT TAT AT CT A 578 

Qy 699 CT T CT T CT T CAGGGAAAT AGCAGT GGAGT AT AACAC CAT G GGAAAGGT AGT T T T CC CAAG 758 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 579 CTTCTTCTT CAG GGAAAT AGCAGT GGAGT AT AACAC CAT G GGAAAGGT AGT T T T CC CAAG 638 

Qy 75 9 AGT GGCTCAGGT TT GT AAGAAT GAT AT GG GAGGAT CT CAAAGAGT C CT GGAGAAAC AGT G 818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 639 AGT GGCTCAGGT T T GTAAGAAT GAT AT GG GAG GAT CT CAAAGAGT C CT G GAGAAACAGT G 698 

Qy 819 GACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTT 87 8 

I I! I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I 
Db 699 GACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTT 758 

Qy 87 9 CAACAT T CT C CAGGCAGTT ACAGAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT C CT GGC 938 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 759 CAAC AT TCT C CAGGCAGTT ACAGAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT CCT GGC 818 

Qy 939 AACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCT 998 

I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I II I I I I I I I I I 

Db 819 AACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCT 87 8 

Qy 999 T GACAT T GC CAGT GTT T T TACT GGGAGAT T CAAGGAACAGAAGT C T C CT GAT T C C AC CT G 1058 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 879 T GACAT TGC CAGT GT T T T TACT GGGAGAT T CAAGGAACAGAAGT CT CCT GATT C C AC CT G 938 

Qy 1059 GACAC CAGT T C CT GAT GAAC GAGTT C CTAAG C C CAGGC C AGGT TGCTGTGCTGGCT CAT C 1118 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 93 9 GACAC CAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATC 998 



Qy 



1119 CT C CT T AGAAAG ATAT GCAAC CT CCAAT GAGT T CC CT GAT GAT AC CCT GAACT T CAT CAA 1178 



Db 999 CT CCTT AGAAAGAT AT G CAAC CT C CAATGAGT T C C CT GAT GATACC CT GAACT T CAT CAA 1058 

Qy 1179 GAC GCAC CC G CT C AT GGAT GAGGCAGT GC C CT C CAT CTT CAACAGGC CAT G GT T C CT GAG 1238 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1059 GAC GCAC CC G CT CAT G GAT GAGGCAGT GC C CT C CAT CTT CAACAGG C CAT G GT T CCT GAG 1118 

Qy 1239 AACAATGGTCAGATACCGCCTTACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCA 1298 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1119 AACAAT GGT C AGAT AC C GC CT T AC C AAAAT T GCAGT GGAC ACAGCT GCT GGGC CAT AT C A 117 8 

Qy 1299 GAAT CACACT GT GGTT T TT CT GGGAT CAGAGAAGGGAAT CAT CT T GAAGT T TTT GGC CAG 1358 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1179 GAAT CACACT GTGGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CT T GAAGT T TT T GGC CAG 1238 

Qy 1359 AAT AGGAAAT AGT GGT T TT CT AAAT GACAGC CT T TT C CT G GAG GAGAT GAGT GT TT ACAA 1418 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1239 AAT AGGAAAT AGT GGT T TT CT AAAT GACAGC CT T TT C CT GGAGGAGAT GAGT GT TT ACAA 12 98 

Qy 1419 CT CT GAAAAAT GCAGCTAT GAT GGAGT CGAAGACAAAAGGAT CAT GGGC AT GCAGCT GGA 147 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 1299 CT CT GAAAAAT GCAGCTAT GAT GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGA 1358 

Qy 147 9 CAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGG 1538 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1359 CAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGG 1418 

Qy 1539 CCGGTGT GAACGACAT GGGAAGT GTAAAAAAACCTGTATT GCCT CCAGAGACCCAT ATT G 1598 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1419 CCGGTGT GAACGACAT GGGAAGT GTAAAAAAACCTGTATT GCCT CCAGAGACCCAT ATT G 147 8 

Qy 1599 T G GAT GGAT AAAGGAAG GT GGT GC CT GCAG C CAT TT AT CAC C CAAC AG CAG ACTG 1653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1479 T GGAT GGAT AAAG GAAG GT G GT GC CT GCAG C CAT TT ATCAC C CAACAGC AGGACACAGAG 1538 

Qy 1654 ACT T TT GAGCAG GACAT AGAGCGT GG CAAT AC AGAT GGT CT GGG GGACT GT CACAAT T C C 1713 

III III I I I I I I I I I 

Db 1539 AGGCTTTGTTGTCTTTGTGGTCACCGGGTCCACTTTACACAGATGCCTATTAATCACTTC 15 98 

Qy 1714 TTT GT GGCACT GAAT GGGCAT T C CAGT T C C CT CT T GCC C AGCACAAC CAC AT CAGAT T C G 1773 

I I I I I I I I I I I I I I I I III I 

Db 1599 ACT AT GGAGACAGACACAT C CAT CAT AT C ACAGCAGCT C AGAAACGGGC C GT C CAGT GAA 1658 

Qy 1774 ACGGCTCAAGAGGGGTATGAG 17 94 

III I I I I I I I I I I 

Db 1659 AGGGGGTGAGAGGGGAAAGTGCACACTTAACCATTTCGAGTTAGGTTACT GGTT GCCT GT 1718 

Qy 1795 T CT AGGGGAGGAAT GCT GGACT GGAAGCAT CT GCTT GA 1832 

I I I I II I I I I I III II I 

Db 1719 GTCTTACACGCTTAGGGTGGTAATTGGGGTGGGGTTGCTTAAAAGGCAAACACTTTTCCC 1778 

Qy 1833 CT CAC CT GACAGC ACAGAC C CT T T G GGGGCAGT GT CTT C C CAT AAT CAC CAAGACAAGAA 18 92 

III I II I I I I I I I I I I 

Db 1779 CAGACGGAGGCTCCGGTGGCCACAAGGGGGTCGTCGGAAAAGATCCCAACTGGAAGCCCA 18 38 

Qy 1893 GGGAGTGATTCGGGAAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTT 1952 

I I I I II I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I 



Db 1839 GAGAGT GATT CGGGAAAGT T AC CT CAAAGGC CAC GAC CAGC T GGT T C C C GT CAC C CT CT T 1898 

Qy 1953 GGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTA 2012 

I I I I I I I I I I I I I I II I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 99 GGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTA 1958 

Qy 2013 CT GC GT C T GT GAT CAT C GG C G C AAAGAC GT G G CT GT GGT GC AGC GCAAG GAGAAGGAGC T 2072 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1959 CTGCGTCTGT GAT CAT CGGC G CAAAGAC GT GGCT GT G GT GC AGC GCAAG GAGAAGGAGCT 2018 

Qy 2073 CACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGA 2132 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2019 CACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGA 207 8 

Qy 2133 CACT CAAT CCAAAGACC CAAAGC C GGAGGC CAT C CT CAC G C CACT CAT G CACAAC GGCAA 2192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207 9 CACT CAAT CCAAAGACC CAAAG C C G GAGGC CAT C CT CAC GC CACT CAT G CACAAC GG CAA 2138 

Qy 2193 GCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATTAAAGCAGACCAGCACCACCTGGA 2252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2139 G CT C GC CACT C C C GGCAACAC G GC CAAGAT G CT CATT AAAGCAGACC AGC AC CAC CT GGA 2198 

Qy 2253 C CT GAC GGCC CT C C C CAC CC C AGAGT CAAC C C CAACGCT GC AGC AGAAG C GGAAGCC CAG 2312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2199 CCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAG 2258 

Qy 2313 C CGC GG CAGC C GC GAGT GGGAGAGGAAC CAGAAC CT CAT CAAT GC CT GCACAAAGGAC AT 2372 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
,Db 2259 C C GC G GCAGC C GC GAGT GGGAGAGGAAC CAGAAC CT CAT CAAT GC CT GCACAAAGGAC AT 2318 

Qy 2373 GCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCA 2432 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I 
Db 2319 GCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCA 2378 

Qy 2 433 CATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGA 24 92 

I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 2379 CATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAGGGCTACCAGCATGAGTACGTGGA 2438 

Qy 24 93 C CAGCC CAAAAT GAGC GAGGT GGCC CAGAT G GC G CT GGAGGAC CAGGC CG C CAC ACT GGA 2552 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2439 C CAGCC CAAAAT GAGC GAGGT GG C C CAGAT GGC G CT GGAGGAC CAGGC C GC CAC ACT GGA 2498 

Qy 2553 GTAT AAGACC AT CAAGGAAC AT CT CAGCAG CAAGAGT C CCAAC C AT GGGGT GAAC CT T GT 2612 

I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 

Db 2499 GT ATAAGAC CATCAAG GAACAT CT CAGC AGCAAGAGT C CCAAC CAT GG GGT GAAC CT T GT 2558 

Qy 2 613 GGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCC 2672 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2559 GGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCC 2618 

Qy 2673 GGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTC 2732 

I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I 

Db 2619 GGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTC 2678 



Qy 

Db 



2733 
2679 



CTACGGGGTTGACTATAAGAGGAGCTACCCCACGAACTCGCTCACGAGAAGCCACCAGGC 
I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
CT AC GGGGT T GACT ATAAGAG GAG CT AC C C CAC GAACT C GCT C AC GAGAAGCC AC CAGGC 



2792 
2738 



Qy 27 93 CAC CACT CT CAAAAGAAACAACACTAACT CCT CCAAT T C CT CT C AC CT CT C CAGAAAC CA 2 852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 CACCACTCTCAAAAGAAACAACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCA 2798 

Qy 2853 GAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGT 2912 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2799 GAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGT 2858 

Qy 2913 GCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGC 2972 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 28 59 GCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGC 2 918 

Qy 2973 CTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACC 3032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2919 CTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACC 2 978 

Qy 3033 C C C C AAAC CAT CCTTTGCTCCCCTTTC CAC AT C CAT GAAGC C C AAT GAT GC GT GT ACAT A 3092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 297 9 C C CCAAAC CAT CCTTTGCTCCCCTTTC CACAT CCAT GAAGC C CAAT GAT GC GT GTACAT A 3038 

Qy 3093 A 3093 

I 

Db 3039 A 3039 
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(HELI-) HELIX RES INST. 

Ota T, Isogai T, Nishikawa T, Hayashi K, Saito K, Yamamoto J; 
Ishii S, Sugiyama T, Wakamatsu A, Nagai K, Otsuki T; 



DR WPI; 2001-318749/34. 
XX 

PT Primer sets for synthesizing polynucleotides, particularly the 5602 full- 

PT length cDNAs defined in the specification, and for the detection and/or 

PT diagnosis of the abnormality of the proteins encoded by the full-length 

PT cDNAs . 
XX 

PS Claim 8; SEQ ID NO 17153; 2537pp + Sequence Listing; English. 
XX 

CC The present invention describes primer sets for synthesising 5602 full- 

CC length cDNAs defined in the specification. Where a primer set comprises: 

CC (a) an oligo-dT primer and an oligonucleotide complementary to the 

CC complementary strand of a polynucleotide which comprises one of the 5602 

CC nucleotide sequences defined in the specification, where the 

CC oligonucleotide comprises at least 15 nucleotides; or (b) a combination 

CC of an oligonucleotide comprising a sequence complementary to the 

CC complementary strand of a polynucleotide which comprises a 5 f -end 

CC sequence and an oligonucleotide comprising a sequence complementary to a 

CC polynucleotide which comprises a 3 1 -end sequence, where the 

CC oligonucleotide comprises at least 15 nucleotides and the combination of 

CC the 5' -end sequence/3 1 -end sequence is selected from those defined in the 

CC specification. The primer sets can be used in antisense therapy and in 

CC gene therapy. The primers are useful for synthesising polynucleotides, 

CC particularly full-length cDNAs . The primers are also useful for the 

CC detection and/or diagnosis of the abnormality of the proteins encoded by 

CC the full-length cDNAs . The primers allow obtaining of the full-length 

CC cDNAs easily without any specialised methods. AAH03166 to AAH13628 and 

CC AAH13633 to AAH18742 represent human cDNA sequences; AAB92446 to AAB95893 

CC represent human amino acid sequences; and AAH13629 to AAH13632 represent 

CC oligonucleotides, all of which are used in the exemplification of the 

CC present invention 

XX 

SQ Sequence 3041 BP; 804 A; 886 C; 714 G; 637 T; 0 U; 0 Other; 



Query Match 70.6%; Score 2182.4; DB 4; Length 3041; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2183; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 910 C GT AT CAACG GGC GT GAT GT T GT C C T GGCAAC GT T T T CT ACACCTTATAACAGCAT C C CT 969 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II 
Db 1 C GT AT CAACGGGCAT GAT GT T GT C CT GG CAAC GT T T T CT ACACCT T ATAAC AGCAT C C CT 60 



Qy 970 GGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACTGGGAGATTC 1029 

I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 61 GGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACTGGGAGATTC 120 



Qy 1030 AAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT CCT GAT GAACGAGTT CCTAAG 1089 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AAGGAACAGAAGTCTCCT GATT CCACCT GGACACCAGTT CCT GAT GAACGAGTT CCTAAG 18 0 



Qy 1090 CCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACCTCCAATGAG 1149 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACCTCCAATGAG 24 0 



Qy 1150 T T C C CT GAT GAT AC CCT GAACT T CAT CAAGAC G CAC C C GCT CAT GGAT GAG GCAGT GC C C 1209 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 41 T T C C CT GAT GAT AC CCT GAACT T CAT CAAGAC G C ACC C GCT CAT G GAT GAGGCAGT GC C C 300 



Qy 1210 T C CAT CTT CAACAG GC C AT GGT T C CT GAGAACAAT GGT CAGAT AC C GC CT T AC CAAAAT T 12 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T C CAT CTT CAACAG GC CAT GGT T C C T GAGAACAAT GGT CAGAT AC C GC CT T AC CAAAAT T 360 

Qy 1270 G CAGT GGAC AC AGCT GCT GGGC CAT AT CAGAAT CACACT GTGGTTTTTCT GGGAT CAGAG 1329 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 G CAGT GGAC AC AGCT GCT GGGC CAT AT CAGAAT CACACT GTGGTTTTTCT GGGAT CAGAG 420 

Qy 1330 AAGGGAAT CAT CT T GAAGT TT T T GGC CAGAAT AG GAAAT AGT GGT T TT C T AAAT GAC AGC 1389 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AAGGGAAT CAT CTT GAAGT TT T T GGC CAGAAT AG GAAAT AGT GGT T TT CT AAAT GACAGC 480 

Qy 1390 CTTT TCCT GGAGGAGAT GAGT GTTT ACAACTCT GAAAAATGCAGCTAT GAT GGAGT CGAA 144 9 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CTTTT CCT GGAGGAGAT GAGT GTTTACAACT CT GAAAAATGCAGCTAT GAT GGAGT CGAA 54 0 

Qy 145 0 GACAAAAGGATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTC 1509 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 541 GACAAAAGGATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTC 600 

Qy 1510 TCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAA 1569 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAGTGTAAAAAA 660 

Qy 157 0 AC CT GT AT T GC CT C C AGAGAC C CAT ATT GT GGAT G GAT AAAGGAAGGT G GT GC CT G C AGC 1629 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I i I I I II I I I I I I I 
Db 661 AC CT GT AT T GC CT C CAGAGAC C CAT ATT GT GGAT GGAT AAAGGAAGGT GGT G C CT GCAGC 720 

Qy 1630 CATT TAT CAC C CAACAGCAGACT GACTTTT GAGCAGGACATAGAGC GT GGCAATACAGAT 1689 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CATT TAT CAC C CAACAGCAGACT GACTT T T GAGC AGGACAT AGAG C GT GGCAATACAGAT 7 80 

Qy 1690 GGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGTTCCCTCTTG 1749 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 781 GGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGTTCCCTCTTG 840 

Qy 1750 C C C AG CACAAC CAC AT CAGAT T CGAC G G CT CAAGAGGGGT AT GAGT CT AGGGGAG GAAT G 1809 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 C C C AGCACAAC CAC AT CAGAT T CGACGGC T CAAGAGGG GT AT GAGT CT AGG GGAG GAAT G 900 

Qy 1810 CT G GACT GGAAGCAT CT GCTT GACT CAC CT GACAGC AC AGAC CCT T T GGGGGCAGT GT C T 1869 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 901 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 960 

Qy 187 0 T C C CAT AATCAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT T AC CT CAAAGGC CAC GAC 192 9 

I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 9 61 T CC C ATAAT C ACCAAGACAAGAAGGGAGT GAT T C GGGAAAGT T AC CT CAAAG GC CAC GAC 1020 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1080 



Qy 

Db 



1990 
1081 



2049 



1140 



Qy 2050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1141 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 12 00 

Qy 2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M 

Db 1201 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 12 60 

Qy 2170 AC GC C ACT CAT G CACAAC GGCAAGCT CG C CACT CC C GGCAAC ACG GC CAAGAT GCT CAT T 2229 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 1320 

Qy 2230 AAAGC AGAC CAGCAC CAC CT GGACCT GAC GGC C CT C CC C AC C C CAGAGT CAAC CC CAAC G 22 89 

I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1321 AAAGC AGAC CAGCAC CAC CTGGACCT GAC GGC C CT C CC C AC C C CAGAGT CAAC C C CAAC G 1380 

Qy 2290 CT GCAGCAGAAGCGGAAGC CCAGCCGCGGCAGCCGC GAGT GGGAGAGGAACCAGAACCT C 234 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CT GC AGCAGAAGCG GAAGC CCAGCC G CGGCAGCC G C GAGT G GGAGAGGAAC C AGAAC CT C 1440 

Qy 2350 AT CAAT GC CT G C ACAAAGGAC AT G C C CC C CAT GGGCTC C C C T GT GAT T C C CAC GGAC CT G 2 4 09 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 AT CAAT GC CT G CACAAAGGACAT GC C CC C CAT GGGCTCCCCT GTGAT T C C CAC GGAC CT G 1500 

Qy 2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 1560 

Qy 247 0 GGCT AC CAGCAT GAGTAC GT GGAC C AGC C CAAAAT GAGC GAGGT GGCC C AGAT GGC GCT G 252 9 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1561 GGCT AC C AG CAT GAGTAC GT GGAC C AGC C CAAAAT GAGC GAGGT GG CC CAGAT GG C GCT G 1620 

Qy 2530 GAGGAC C AGGC C GC CACACT G GAGT AT AAGAC CAT CAAGGAACAT C T C AGC AGCAAGAGT 2589 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1621 GAGGACC AGGC C GC CAC ACT GGAGT AT AAGAC CAT CAAG GAACAT CT C AGCAGCAAGAGT 1680 

Qy 2590 C C CAAC CAT G GGGT GAAC CTT GT GGAGAACCT GGACAGC CT G C C CC CCAAAGTT C CAC AG 2649 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 1681 C C CAAC CAT GGGGT GAAC CTT GT GGAGAACCT GGAC AG C CT GC C C C CCAAAGT T C CAC AG 17 40 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 27 09 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 1800 

Qy 2710 CT G GAAAT GCAC CACTC CT CT T CCT AC GGGGT T GACT AT AAGAG GAGCT AC C C CAC GAAC 2769 

I I II I I I I I I II I I I I I I I II I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I II M I I 
Db 18 01 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 18 60 

Qy 2770 T C GCT CAC GAGAAG C CAC CAGG CCAC C ACT CT CAAAAGAAACAACACTAACT C CT C CAAT 2829 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I 
Db 1861 T C G CT CAC GAGAAGC CAC CAGGCC AC CACTCT CAAAAGAAACAACACTAACT C CT C CAAT 1920 

Qy 28 30 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 2889 

I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1921 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 1980 

Qy 28 90 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 2 949 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 2 040 



Qy 



2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 




Db 



2041 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 2100 



Qy 



3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 




Db 



2101 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 2160 



Qy 



Db 



307 0 AAGC C CAAT GAT GC GT GT ACAT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I 
2161 AAGC C CAAT GAT GC GT GT ACAT AA 2184 



RESULT 14 
AAA93630 

ID AAA93630 standard; cDNA; 1890 BP. 
XX 

AC AAA93630; 
XX 

DT 16-JAN-2001 (first entry) 
XX 

DE Human semaphorin protein-like splice variant SECX pCR2 . 1-2 8 64933 cDNA. 
XX 

KW SECX protein; human; secreted; membrane-associated; cancer; 

KW proliferation regulator; differentiation regulator; non-malignant tumour; 

KW immune disorder; autoimmune disease; transplant rejection; allergy; AIDS; 

KW infection; inflammatory disorder; arthritis; haematopoietic disorder; 

KW skin disorder; cardiovascular disorder; atherosclerosis; restenosis; 

KW neurological disease; Alzheimer's disease; trauma; wounding; 

KW spinal cord injury; skeletal disorder; cytostatic; immunosuppressive; 

KW anti-HIV; antiinflammatory; antiarthritic ; antiarteriosclerotic; 

KW neuroprotective; vulnerary; antiallergic; antimicrobial; cardiant; 

KW dermatological ; gene therapy; ss. 

XX 

OS Homo sapiens. 
XX 

PN WO200053742-A2. 
XX 

PD 14-SEP-2000. 
XX 

PF 09-MAR-2000; 2000WO-US00628 0 . 
XX 

PR 09-MAR-1999; 99US- 0123667P . 

PR 08-MAR-2000; 2000US-0520781P . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Shimkets RA; 
XX 

DR WPI; 2000-594318/56. 

DR P-PSDB; AAB23043. 
XX 

PT Novel human membrane associated or secreted polypeptides and 

PT polynucleotides useful for diagnosis, prevention and treatment of 



PT pathological states such as cancer, immune, cardiovascular and 

PT neurological disorders. 

XX 

PS Claim 3; Fig 15; 151pp; English. 
XX 

CC Sequences AAA93616-A93631 and AAA93673-A93676 represent nucleic acids 

CC which encode human SECX proteins (AAB23029-B23048 ) . The SECX proteins of 

CC the invention are either secreted or membrane-associated proteins and act 

CC as regulator of cellular proliferation and differentiation. SECX proteins 

CC or nucleotides are useful for diagnosing the presence of, or 

CC predisposition to, a disease associated with altered levels of SECX 

CC proteins and nucleotides. The SECX proteins are also useful to screen 

CC compounds that modulate SECX activity or expression. The interaction of a 

CC SECX protein with other cellular proteins may be useful to modulate the 

CC activity of a partner protein, cellular proliferation, cellular 

CC differentiation and cell survival. SECX nucleotides are useful for the 

CC recombinant expression of SECX protein, and may be used detect SECX mRNA 

CC or genetic lesions in the SECX gene. They may also be used to modulate 

CC SECX expression (e.g., using antisense oligonucleotides). SECX nucleic 

CC acid sequences are also useful for identifying a cell or tissue type in a 

CC biological sample, and in forensic biology. SECX primers or probes are 

CC useful for detecting the presence of SECX nucleotides and for screening 

CC tissue cultures for contamination. Diseases that may be treated or 

CC prevented using SECX proteins or nucleotides include cancer (e.g., 

CC colorectal carcinoma, prostate cancer), benign tumours, immune disorders 

CC (including autoimmune diseases, transplant rejection, allergies, AIDS), 

CC infections, inflammatory disorders, arthritis, haematopoietic disorders, 

CC skin disorders, cardiovascular disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g., Alzheimer's disease), trauma (e.g., surgical 

CC or traumatic wounds, spinal cord injury) , and skeletal disorders 

XX 

SQ Sequence 1890 BP; 535 A; 426 C; 463 G; 466 T; 0 U; 0 Other; 



Query Match 60.8%; Score 1881.6; DB 3; Length 1890; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1884; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 



Qy 


49 


GGGGCT GGT TT C C CAGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT G GCAACT AT ACAAAA 


108 






II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


G GAT CCGGTTTCC CAGAAGAT T C T GAGCCAAT CAGT AT T T C GCAT GGCAACT AT ACAAAA 


60 


Qy 


109 


CAGTATCCGGTGTTTGTGGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCTG 


168 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 M 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


61 


CAGT AT CCGGTGTTTGTGGGC C ACAAGC CAG GAC G GAAC ACC ACACAGAG G C ACAGGCT G 


120 


Qy 


169 


GACAT CCAGATGATT ATGATCAT GAACGGAAC CCT CTACATTGCT GCTAGGGACCATATT 


228 






M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


GACAT C C AGAT GAT TAT GAT CAT GAAC G GAAC CCT CT AC AT T G CT GCT AGGGACC AT AT T 


180 


Qy 


229 


T AT ACT GTT GAT AT AGAC ACAT CACACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GAC A 


288 






1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 II i 1 1 II 1 1 1 1 1 




Db 


181 


TAT ACT GT T GATAT AGAC ACAT CACACAC GGAAGAAAT T T AT T GT AGCAAAAAACT GAC A 


240 


Qy 


289 


T G GAAAT CT AGACAGGC C GAT GT AGACACAT G CAGAAT GAAGG GAAAACAT AAGGAT GAG 


348 






1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


T GGAAAT CT AGACAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAG 


300 



Qy 34 9 T G C C AC AACT T TAT T AAAGT T CT T C T AAAG AAAAAC GAT GAT G CAT T GT T T GT CT GT GGA 4 08 

I I II I I I I I I I I I I I I I I I I I I' I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T GC C ACAACTT T AT TAAAGTT CT T C T AAAGAAAAACGAT GAT G CAT T GT T TGT CT GT GGA 360 

Qy 409 ACT AAT GC CTT CAAC C CTT CCT GC AGAAACT ATAAGAT G GATACAT T GGAAC CAT T CG G G 468 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 361 ACT AAT GC CTT CAAC C CTT CCT GC AGAAACT ATAAGAT G GATACAT T GGAAC CAT T CG G G 420 

Qy 469 GAT GAATT CAGCGGAATGGCCAGAT GCC CAT AT GAT GCCAAACAT GCCAACGTTGCACT G 528 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GAT GAATT CAGCGGAATGGCCAGAT GCC CAT AT GAT GCCAAACAT GCCAACGTTGCACTG 480 

Qy 529 TTTGCAGAT GGAAAACTATACT CAGCCACAGT GACT GACTT CCTT GCCATTGACGCAGT C 588 

I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 
Db 481 TTTGCAGAT GGAAAACTATACT CAGCCACAGT GACT GACTT CCTT GCCATTGACGCAGT C 540 

Qy 58 9 AT T T AC C GGAGT CTT GGAGAAAG C C CT AC CC T GC GGAC C GT CAAGC AC GATT CAAAAT G G 648 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT T T AC C G GAGT CT T GGAGAAAGC C CT AC CCT GC GGAC C GT CAAGCAC GATT CAAAAT GG 600 

Qy 64 9 TT GAAAGAACCATACTTT GTT CAAGCCGT GGATTACGGAGATTAT ATCTACTT CTT CTT C 7 08 

I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 601 T T GAAAGAAC CAT ACT TT GTT CAAGC CGT GGAT T AC GGAGAT TAT AT CT ACT T CTT CT T C 660 

Qy 709 AGGGAAAT AGCAGT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T C C CAAGAGT GG CT C AG 7 68 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 AGGGAAAT AGCAGT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T C C CAAGAGT GGCTC AG 720 

Qy 7 69 GTTT GTAAGAAT GAT AT GGGAGGAT CTCAAAGAGTCCT GGAGAAACAGT GGACGT CGTT C 828 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 721 GT TT GTAAGAAT GAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT C GT T C 780 

Qy 82 9 CTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTC 8 88 

II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 781 CTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTC 840 

Qy 889 C AGG CAGT T ACAGAT GT GATT C GT AT CAACGG GC GT GAT GT T GT C CT GGCAACGT TTT CT 948 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I II M I I I I I I I I 
Db 841 CAGGCAGTTACAGATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCT 900 

Qy 949 ACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCC 1008 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ACAC CTTATAACAGCAT CCCT GGGT CT GCAGT CT GT GCCTAT GACAT GCTT GACATTGCC 960 

Qy 1009 AGT GT TT T TACT GGGAGAT T CAAG GAAC AGAAGT CT C CT GAT TC C AC CT GGACAC CAGT T 1068 

I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AGT GT TT T TACT GGGAGAT T C AAGGAACAGAAGT CT C CT GATT C C AC CT GGACAC CAGT T 1020 

Qy 1069 CCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAA 1128 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I II II I I I I 
Db 1021 CCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAA 1080 

Qy 1129 AGATAT GCAACCTCCAATGAGTTCCCT GAT GATACCCT GAACTT CAT CAAGACGCAC CC G 1188 

I I I I I I II I I I I I M I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1081 AGATAT GCAACCT CCAAT GAGTTCC CTGAT GATACCCT GAACTT CAT CAAGACGCACCCG 1140 



Qy 1189 CT C AT G GAT GAGGCAGT GCC CT C C AT CT T CAAC AGGC CAT GGTT C CT GAGAACAATGGT C 124 8 



Db 1141 CTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTC 1200 

Qy 1249 AGAT AC C GCCT TAC CAAAAT T G CAGT GGAC ACAGCT GCT GGG C CAT AT CAGAAT C ACACT 1308 

I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 AGAT AC C G CCT TAC CAAAAT T GCAGT GGAC ACAGCT GCT GGG C CAT AT CAGAAT C ACACT 1260 

Qy 1309 GT GGT TT T T CT GG GAT C AGAGAAG G GAAT C AT CT T GAAGT T T TT GGC CAGAAT AGGAAAT 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GTGGTTTTTCT GGGAT CAGAGAAGGGAATCAT CTT GAAGTTTTT GGCCAGAAT AGGAAAT 1320 

Qy 1369 AGT GGT T T T C T AAAT GACAG CCTTTTCC T GGAG GAGAT GAGT GT T TACAACT CT GAAAAA 142 8 

I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1321 AGT GGTTTTCTAAATGACAGCCTTTT CCT GGAGGAGAT GAGT GTTTACAACTCT GAAAAA 1380 

Qy 1429 T GC AGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GGG CAT GC AGCT GGACAGAG CAAGC 14 8 8 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 T GC AGCT AT GAT GGAGT C GAAGACAAAAGGAT C AT GGGCAT GCAGCT GGACAGAGCAAGC 144 0 

Qy 14 89 AGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAA 154 8 

I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1441 AGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAA 1500 

Qy 1549 C GAC AT G G GAAGT GTAAAAAAAC CT GT ATT GC CT C CAGAGAC C CAT AT T GT GGAT GGATA 1608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1501 C GAC AT GGGAAGT GTAAAAAAAC CT GT ATT G C CT C CAGAGAC C CAT ATT GT GGAT GGATA 1560 

Qy 1609 AAGGAAGGT GGT GC CT GCAGC CAT T TAT CAC C CAAC AGCAGACT GACT TT T GAGCAGGAC 1668 

I I I I I I II II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 

Db 1561 AAGGAAGGT GGTGCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGAC 1620 

Qy 1669 AT AGAG C GT GG CAATACAGAT GGT CT GGGGGACT GT CACAAT T C CTT T GT GGC ACT GAAT 1728 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 ATAGAGCGTGGCAATACAGATGGT CT GGGGGACT GT CACAATT CCTTT GT GGCACTGAAT 1680 

Qy 1729 GGG CAT T CC AGTT C CCT CT T GCC CAG C ACAACC AC AT CAGATT C GAC GGCT CAAGAGG GG 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GGGCATTCCAGTTCCCTCTTGCCCAGCACAACCACATCAGATTCGACGGCTCAAGAGGGG 174 0 

Qy 17 89 TAT GAGT CT AGGGGAGGAAT GCT GGACT GGAAGC AT CT G C T T GACT CACCT GAC AGCACA 1848 

I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TAT GAGT CT AGGGGAGGAAT GCT GGACT GGAAGCAT CTGCTTGACTCACCT GACAGCACA 18 00 

Qy 1849 GAC C CT T T GGGGGCAGT GT C T T C C CAT AAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAA 1908 

I I I I I I II II I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 01 GAC CCTTT G GGGGCAGT GT CTT C C CAT AAT CACCAAGACAAGAAGGGAGT GAT T C GG GAA 1860 

Qy 1909 AGTTACCTCAAAGGCCACGACCAGCTGG 1936 

II I II I I I I I I I I I I I I I I I I I I I I I I 

Db 18 61 AGT TAC CT CAAAGG C CAC GAC C AGCT CG 1888 



RESULT 15 
ADA23359 

ID ADA23359 standard; cDNA; 1890 BP. 
XX 

AC ADA23359; 



XX 

DT 20-NOV-2003 (first entry) 
XX 

DE cDNA encoding human SECX polypeptide, SEC3 #2. 
XX 

KW Human; secreted polypeptide; membrane-associated polypeptide; SECX; SEC1; 

KW SEC2; SEC3; SEC4 ; SEC5; SEC6; SEC7; SEC8; SEC9; SEC10; SEC11; SEC12; 

KW SEC13; SEC14; SEC15; SECX-associated disorder; lung cancer; 

KW cardiovascular disease; oncology disease; immune disorder; 

KW autoimmune disease; transplant rejection; allergy; AIDS; infections; 

KW inflammatory disorder; arthritis; haematopoietic disorder; skin disorder ; 

KW atherosclerosis; restenosis; neurological disease; Alzheimer's disease; 

KW trauma; wounds; spinal cord injury; skeletal disorder; cytostatic; 

KW antiinflammatory; immunosuppressive; anti-HIV; antiarthritic; 

KW antiarteriosclerotic; cardiant; neuroprotective; nootropic; vulnerary; 

KW antiallergic; cardiant; dermatological ; gene; ss. 

XX 

OS Homo sapiens . 
XX 

PN US2003054514-A1. 
XX 

PD 20-MAR-2003. 
XX 

PF 19-SEP-2001; 2 001US-00957 187 . 
XX 

PR 09-MAR-1999; 99US-0123667 P . 

PR 04-JAN-2000; 2000US-0174485P . 

PR 08-MAR-2000; 2000US-00520781 . 

PR 19-SEP-2000; 2000US-0233798P . 

PR 20-SEP-2000; 2000US-0234 082 P . 
XX 

PA (SHIM/) SHIMKETS R A. 

PA (LARO/) LAROCHELLE W J. 
XX 

PI Shimkets RA, Larochelle WJ; 
XX 

DR WPI; 2003-540616/51. 

DR P-PSDB; ADA23360. 
XX 

PT New SECX nucleic acids, useful for treating or diagnosing a disorder 

PT e.g., lung cancer, cardiovascular and oncology diseases, immune disorder, 

PT and autoimmune disease. 

XX 

PS Claim 3; Page 7; 118pp; English. 
XX 

CC The present invention relates to the isolation of human secreted or 

CC membrane-associated (SECX) polypeptides designated SEC1-SEC15, and the 

CC polynucleotide sequences encoding them. Also disclosed is a method for 

CC screening for a modulator of activity or latency of SECX. The SECX 

CC polypeptide and polynucleotide sequences may be used for treating or 

CC preventing SECX-associated disorders such as lung cancer, cardiovascular 

CC and oncology diseases, immune disorders, autoimmune diseases, transplant 

CC rejection, allergy, AIDS, infections, inflammatory disorders, arthritis, 

CC haematopoietic disorders, skin disorders, atherosclerosis, restenosis, 

CC neurological diseases (e.g. Alzheimer's disease), trauma, wounds, spinal 

CC cord injuries, and skeletal disorders. The present sequence encodes a 

CC SECX polypeptide of the invention. 



SQ Sequence 1890 BP; 535 A; 426 C; 463 G; 466 T; 0 U; 0 Other; 



Query Match 60.8%; Score 1881.6; DB 8; Length 1890; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 18 84; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 4 9 GGGGCT GGTTT CCCAGAAGATT CT GAGC CAAT CAGTATTTCGCAT GGCAACT AT ACAAAA 108 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1 GGAT CCGGT TT CCCAGAAGATT CTGAGC CAAT CAGTATTTCGCAT GGCAACT AT ACAAAA 60 

Qy 109 C AGT AT C C GGT GTT T GT G GG C CACAAGC CAG GAC GGAACAC CACAC AGAGGC AC AGGCT G 168 

M I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I II II I I I I I I II I I I I I I I I I I 
Db 61 C AGT AT CC G GT GTT T GT GGG C CACAAGC CAG GAC GGAACAC CACAC AGAGG C AC AGGCT G 120 

Qy 169 GACATCCAGAT GATTAT GAT CATGAACGGAACCCT CTACATT GCT GCT AGGGACCATATT 228 

I I I I II I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACAT C C AGAT GAT TAT GAT CAT GAACGGAAC CC T CT ACAT T GCT G C T AGGGAC CAT AT T 180 

Qy 22 9 TAT ACT GT T G AT AT AGAC AC AT CACACAC GGAAGAAAT TT AT T GT AGCAAAAAACT GACA 288 

I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 181 TAT ACT GT T GAT AT AGAC AC AT CACAC AC GGAAGAAAT T TAT T GT AGCAAAAAACT GACA 240 

Qy 2 89 T GGAAAT CT AGACAGGC C GAT GTAGAC ACAT GC AGAAT GAAG GGAAAACAT AAGGAT GAG 34 8 

I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 241 T GGAAAT CTAGACAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAG 300 

Qy 34 9 T GC C ACAACT T TAT T AAAGT T CTT CTAAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGA 4 08 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3 01 T GC C ACAACT T TAT TAAAGT T CTT CTAAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGA 360 

Qy 4 09 ACTAAT GC CTT C AAC CCTTCCTG C AGAAACTAT AAGAT GGAT AC AT T GGAAC CAT T C GGG 4 68 

I I I I I I I I I I I I I I I I I I II I I I I I II I M I I I II I I I I I I I I II I I I I I I I I I I I I I I I 
Db 361 ACT AAT GC CT T CAAC CCT T C CT G CAGAAAC TAT AAGAT G GAT AC AT T GGAAC CAT T C G GG 420 

Qy 4 69 GAT GAAT T CAG C GGAAT G GC C AGAT GC C CAT AT GAT GCCAAACAT GC CAAC GTT GCACT G 528 

I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M 
Db 421 GAT GAAT T CAGC GGAAT GGCC AGAT GCC CATATGATGCCAAACAT GCCAAC GTT GCACT G 4 80 

Qy 529 TTT GCAGAT GGAAAACTATACTCAGCCACAGT GACTGACTT CCTT GCCATT GACGCAGT C 588 

I M I I I I I II I I I I I I I II I i I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 TTT GCAGAT GGAAAACT AT ACT CAGC CACAGT GACT GACTT C CT T GC C ATT GAC GCAGT C 540 

Qy 589 ATT T AC C GGAGT CT T GGAGAAAG C C CT ACC CT G C GGACC GT CAAG CAC GAT T CAAAAT GG 64 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I 
Db 541 ATT T AC C GGAGT CT T GGAGAAAG C C CT ACC CT GC GGAC C GT CAAG CAC GAT T CAAAAT GG 600 

Qy 649 T TGAAAGAAC CAT ACT T T GT T CAAG C C GTGGATT ACGGAGAT TAT AT CT ACT TCTTCTTC 708 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I 
Db 601 T T GAAAGAAC CAT ACT T T GT T CAAGC C GT GGAT T ACG GAGAT TAT AT CT ACT T CT TCT T C 660 

Qy 7 09 AGGGAAAT AG C AGT GGAGT AT AAC AC CAT GGGAAAGGT AGT T TT C CCAAGAGT GGCT CAG 7 68 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I 
Db 661 AG GGAAAT AGCAGT GGAGTATAAC AC CAT GGGAAAGGT AGT T TT C CCAAGAGT GGCT CAG 720 

Qy 7 69 GTT T GT AAGAAT GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGAC GT CGT T C 828 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 



Db 721 GT T T GT AAGAAT GAT AT GGGAGGATCT CAAAGAGT CCT GGAGAAAC AGT G GAC GT C GT T C 78 0 

Qy 829 C T GAAGGCGC GCT T GAACT G C T C AGT T CC T GGAGACT CT CATT T T T AT TT CAACAT T C T C 88 8 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
Db 781 CTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTC 84 0 

Qy 889 CAG GC AGTT ACAGAT GT GAT T C GT AT CAAC GGGC GT GAT GT T GT CC T GG CAAC GT T T T CT 94 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CAG GCAGTT ACAGAT GT GAT T C GTAT CAAC GG GC GT GAT GT T GT CCT GG CAAC GT T T T CT 900 

Qy 949 ACAC CTTATAACAGCAT CCCT GGGTCT GCAGTCT GT GCCTATGACAT GCT T GACATT GCC 1008 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ACAC CT T AT AAC AG CAT CC CT GGGT CT GCAGT CT GT GCCT AT GACAT GCT T GACAT T GC C 960 

Qy 1009 AGT GTTTTTACT GGGAGATT CAAGGAACAGAAGT CT CCT GATT C CAC CTGGACACCAGTT 1068 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AGT GTTTTTACT GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCTGGACACCAGTT 1020 

Qy 1069 CCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAA 1128 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAA 108 0 

Qy 1129 AGATAT GCAACCT CCAATGAGTT CCCT GAT GAT ACCCTGAACTT CAT CAAGACGCACCCG 118 8 

I | | | I I I II I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AGATAT GCAACCT CCAATGAGTT CCCT GAT GAT ACCCTGAACTT CAT CAAGACGCACCCG 114 0 

Qy 1189 CT CAT GGAT GAGGCAGT GC C CT C CAT CTT CAAC AGGC CAT GGT T CCT GAGAACAAT G GT C 1248 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1141 CTCAT GGAT GAGGCAGT GCC CT C CAT CTT CAACAGGCCATGGTT CCT GAGAACAAT GGT C 12 00 

Qy 1249 AGATAC C GC CTT ACCAAAAT T GCAGT GGACAC AGCT GCT G GG C CAT AT C AGAAT CACACT 1308 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 AGATAC C GC CTT ACCAAAAT T G CAGT G GACAC AG CT GCT GG G C CAT AT C AGAAT CACACT 1260 

Qy 1309 GT G GT T T T T CT G GGAT CAGAGAAGGGAAT CAT CT T GAAGT T T T T GG C CAGAAT AGGAAAT 1368 

II I II I I I M I I I I M I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GTGGTTTTT CTGGGAT CAGAGAAGGGAAT CAT CTT GAAGTT T T T GGC CAGAAT AGGAAAT 1320 

Qy 1369 AGT GGT T TT CT AAAT GAC AGCCT T TT C CT GGAGGAGAT GAGT GT TT ACAACT CT GAAAAA 1428 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1321 AGTGGTTTTCTAAATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTACAACTCTGAAAAA 138 0 

Qy 142 9 T GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GGGCAT GC AGCT GGACAGAGCAAG C 14 8 8 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 T GCAGCTATGAT GGAGTCGAAGACAAAAGGAT CAT GGGCATGCAGCT GGACAGAGCAAGC 144 0 

Qy 1489 AGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAA 1548 

I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1441 AGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAA 1500 

Qy 1549 C GACAT GG GAAGT GTAAAAAAAC CT GTAT T GC CT C C AGAGAC C CAT ATT GT GGAT G GAT A 1608 

I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I M I I I I I M I M I I I I I I I I I 

Db 1501 C GACAT G GGAAGT GT AAAAAAACCT GTAT T GC CT C C AGAGAC C CAT ATT GT GGAT GGAT A 1560 

Qy 1609 AAGGAAGGT GGT GCCT GCAGC C ATTTAT C ACC CAACAGCAGACTGACTT T T GAGC AGGAC 1668 

I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1561 AAGGAAGGT GGT GCCT GCAGCC ATTTAT CACC CAACAGCAGACTGACTTTTGAGCAGGAC 1620 



Qy 1669 AT AGAGC GT G GCAAT AC AGAT GGT CT GGG GGACT GT CACAAT TCCTTTGT GGCACT GAAT 1728 

M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AT AGAGCGT GGCAAT ACAGATGGT CT GG G GGACT GT CACAAT T C CT T T GT GGCACT GAAT 1680 

Qy 1729 GGGCAT T C C AGT TCCCTCTTGCC CAGCACAAC C AC AT CAGAT T C GAC G GCTCAAGAG GG G 17 88 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1681 GGGCATTCCAGTTCCCTCTTGCCCAGCACAACCACATCAGATTCGACGGCTCAAGAGGGG 1740 

Qy 17 8 9 TAT GAGTCT AGGGGAGGAAT GCT GGACT GGAAGCAT CTGCTTGACT CACCTGACAGCACA 1848 

I || I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1741 TAT GAGT CT AGG GGAGGAAT GCT GGACT G GAAGC AT CT GCTT GACT C AC CT GAC AGCAC A 1800 

Qy 1849 GAC C C T TT G GG GGCAGT GT CT T C CC AT AAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAA 1908 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 01 GAC C CT TT GGG GGCAGT GT CT T C CCAT AAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAA 18 60 

Qy 1909 AGTTACCTCAAAGGCCACGACCAGCTGG 1936 

I I I I I I I II I I I I I I I II I I I I I II I I 
Db 18 61 AGT T AC CT CAAAG G C CAC GAC C AGCT CG 18 8 8 



Search completed: March 26, 2004, 00:01:20 
Job time : 1254.51 sees 
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Copyright (c) 1993 - 2004 Compugen Ltd. 
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Sequence : 
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(without alignments) 
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1 atgaggtcagaagccttgct ccaatgatgcgtgtacataa 3093 
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Scoring table: IDENTITY_NUC 
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Searched: 682709 seqs, 277475446 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 
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ALIGNMENTS 



RESULT 1 

US-09-976-594-1002 

; Sequence 1002, Application US/09976594 
; Patent No. 6673549 
; GENERAL INFORMATION: 

APPLICANT: Furness, Michael 
; APPLICANT: Buchbinder, Jenny 

; TITLE OF INVENTION: GENES EXPRESSED IN C3A LIVER CELL CULTURES TREATED WITH 
STEROIDS 

; FILE REFERENCE: PA-0041 US 

; CURRENT APPLICATION NUMBER: US/09/97 6, 594 
; CURRENT FILING DATE: 2001-10-12 
; PRIOR APPLICATION NUMBER: 60/240,409 
; PRIOR FILING DATE: 2000-10-12 
; NUMBER OF SEQ ID NOS : 1143 
; SOFTWARE: PERL Program 
; SEQ ID NO 1002 
LENGTH: 227 8 



TYPE: DNA 

ORGANISM: Homo sapiens 

FEATURE: " 
NAME/ KEY : misc_f eature 

OTHER INFORMATION: Incyte ID No. 6673549 411373.7 
US-09-976-594-1002 

Query Match 64.6%; Score 1998; DB 4; Length 2278; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1998; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 281 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 34 0 

Qy 61 C CAGAAGAT T CT GAGC CAAT C AGT AT T T C GC AT GGCAACTAT ACAAAACAGT AT C C GGT G 12 0 

I I I I I I I I M I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 341 C CAGAAGAT T C T GAG C CAAT C AGT AT T T C GC AT GGCAACTAT ACAAAACAGT AT C C GGT G 400 

Qy 121 T T T GT GGGCCACAAG C C AGGAC GGAAC AC CACACAGAG GCACAGGCT G GAC AT CC AGAT G 180 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4 01 T T T GT GGGC CACAAGC C AGGAC GGAAC AC C AC ACAGAG GCACAGG CTG GAC AT CC AGAT G 4 60 

Qy 181 AT TAT GAT CAT GAAC G GAAC C CT CT AC AT TGC T GCTAGG GAC CAT ATT T AT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 61 AT TAT GAT CAT GAAC G GAAC C CT CT ACAT TGC T G CTAGG GAC CAT ATT TAT ACT GT T GAT 52 0 

Qy 241 AT AGACACAT C ACAC AC GGAAGAAAT T T ATT GT AGCAAAAAACT GACAT GGAAAT CTAGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 521 AT AGACACAT CACACAC GGAAGAAAT T T ATT GT AGCAAAAAACT GACAT GGAAAT CTAGA 580 

Qy 301 CAGGC CGAT GT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 360 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 581 CAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 64 0 

Qy 361 AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GC AT T GTT T GT CT GT GGAAC TAAT GC CT T C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 641 AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GC AT T GTT T GT CT GT GGAAC TAATGC CT T C 7 00 

Qy 421 AACCCTT CCTGCAGAAACTATAAGAT GGAT ACATT GGAACCATTCGGGGAT GAATTCAGC 4 80 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 01 AACC CT T C CT GCAGAAACT ATAAGAT G GAT AC AT T GGAAC CAT T C GGGGAT GAAT T CAGC 760 

Qy 481 GGAAT GG C CAGAT GC C CAT AT GAT GC CAAAC AT GC CAAC GT T GCACTGT TT GCAGAT GGA 54 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 61 GGAAT GG C CAGAT GC C CAT AT GAT GC CAAAC AT GC CAAC GT T GCACTGT T T GCAGAT GGA 820 

Qy 541 AAACT AT ACT C AGC CACAGT GACT GACT T CCT T GC CAT T GAC G CAGTC ATTT ACC GGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 821 AAACTATACTCAGCCACAGTGACTGACTTCCTTGCCATTGACGCAGTCATTTACCGGAGT 880 

Qy 601 CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 660 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I 
Db 881 CT TG GAGAAAG C C CT AC C CT GC GGAC C GT CAAGC AC GAT TCAAAAT GGT T GAAAGAAC C A 94 0 



QY 



661 



TACT T T GT T CAAGC C GT GGAT TAC GGAGATT AT AT CTACTT CT T CT T C AGG GAAAT AGC A 
I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



720 



Db 941 T ACT T T GT T CAAG C C GT GGAT TAC GGAGAT TAT AT CT AC TT CTT CTT C AGG GAAAT AG CA 1000 

Qy 721 GTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAAT 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1001 GT GGAGT ATAACAC CAT GGGAAAGGTAGT T T T CC CAAGAGT G GCT CAGGT T T GT AAGAAT 1060 

Qy 781 GAT AT GGGAG GAT CT CAAAGAGT C CTGG AGAAAC AGT GGAC GT C GTT C CT GAAGGC G C G C 84 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1061 GAT AT GGGAG GAT CT CAAAGAGT C CTGGAGAAAC AGT GGAC GTC GTT C CT GAAG G C GC G C 1120 

Qy 841 T T GAACT GCT C AGT T C CT GGAGACT CT CAT T TTT ATT T CAACAT T CT C CAGGCAGTT ACA 900 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1121 T T GAACT GCT C AGTT CCT GGAGACT CT CATTTTT ATTT CAACATT CT C CAGGCAGTT ACA 1180 

Qy 901 GAT GT GAT T C GT AT CAAC GGGC GT GAT GT T GT CCT GGCAAC GTT T T CT AC AC CT T ATAAC 960 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1181 GAT GT GAT T C GT AT CAAC GGGC GT GAT GTT GT CCT GGCAAC GTT T T CT AC AC CTT ATAAC 124 0 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1241 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1300 

Qy 1021 GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT CCT GAT GAACGA 1080 

I I I I I I I M M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1301 GGGAGATT CAAGGAACAGAAGT CT CCT GATT CCACCT GGACACCAGTT C CT GAT GAACGA 1360 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1361 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 142 0 

Qy 1141 T CCAATGAGTT CC CT GAT GATACCCTGAACTTCAT CAAGACGCACCCGCT CATGGAT GAG 1200 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1421 T CCAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC CC GCT CAT GGAT GAG 14 80 

Qy 12 01 G CAGT GC C CT C CAT CTT CAACAGG C CAT GGT T C CT GAGAAC AAT GGT CAGAT AC C GC CT T 1260 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I II 

Db 1481 GCAGT GC C CT C CAT CTT CAACAGGC C AT GGTT CCT GAGAACAAT GGT CAGAT AC C GC CTT 1540 

Qy 1261 ACCAAAATTGCAGT GGACACAGCT GCT GGGCCAT ATCAGAAT CACACT GT GGTT TTT CT G 1320 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1541 ACCAAAAT T GCAGT GGACACAGCT GCT G GGC CAT AT C AGAAT CACACT GT GGTT TTT CT G 1600 

Qy 1321 GGAT CAGAGAAGGGAAT CAT CTT GAAGTTTTT GGCCAGAATAGGAAAT AGT GGTTTT CTA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1601 GGAT CAGAGAAGG GAAT CAT CTT GAAGT TT T T G G C CAGAATAGGAAAT AGT GGT T TT CTA 1660 

Qy 1381 AAT GAC AG CCT TT T CCT GGAGGAGAT GAGT GT T T ACAACT C T GAAAAAT GCAGCT AT GAT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1661 AAT GAC AGCCT TT T CCT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GCAGCT AT GAT 1720 

Qy 1441 GGAGT C GAAGACAAAAG GAT CAT GGGCAT GCAG CT GGAC AGAG CAAGCAGCT CT CTGT AT 1500 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1721 G GAGT C GAAGACAAAAGGAT CAT GGGCATGCAGC T GGAC AGAG CAAGCAG CT CT CT GT AT 178 0 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I II I I II I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I II 

Db 17 81 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 184 0 



Qy 1561 T GT AAAAAAAC CT GT AT T GC CT CCAGAG AC C CAT AT T GT G GAT G GAT AAAGGAAGGT GGT 1620 

I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I 1 I I I M I I I I I I II I I II I I I I 

Db 1841 T GT AAAAAAACCT GT ATT GC C T CC AGAGAC C CAT AT T GT GGAT G GAT AAAGGAAG GT GGT 1900 

Qy 1621 G C CT GCAGC C AT TT AT C AC C CAACAGC AGACT GACT T T T GAG CAGGACAT AGAGC GT GG C 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1901 GC CT GCAGC CAT TT AT CAC C CAACAGC AGACT GACTT T T GAGCAGGACAT AGAGC GT GGC 1960 

Qy 1681 AATACAGAT GGT CT G GGG GACT GT CACAAT T C CT T T GT GG C ACT GAAT GG G CAT T C C AGT 1740 

I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1961 AATACAGAT GGT CT G GGGGAC T GT CACAAT T C CT T T GT GGC ACT GAAT GGGCAT T C C AGT 2020 

Qy 1741 TCCCTCTTGCC CAGCACAAC C ACAT CAGATT C GAC GG C T CAAGAGGGGTAT GAGT CT AGG 1800 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 2021 T CC CT CT T GC C CAGCACAAC C ACAT CAGAT T C GAC GGC T CAAGAGGGGTAT GAGT CT AG G 208 0 

Qy 1801 G GAGGAAT GCT GGAC T GGAAG CAT CT GCT T GACT CAC CT GACAGCACAGAC CCTTTGGGG 18 60 

I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2081 GGAG GAAT GC T GGACT GGAAGCAT CT GCTT GACT CAC CT GACAGCACAGAC CCTTTGGGG 214 0 

Qy 1861 G CAGT GT CTT C CC AT AAT CAC CAAGACAAGAAGGGAGT GAT T C G GGAAAGT TAC CT CAAA 1920 

fl I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2141 GCAGT GT CTT CCCATAAT CAC CAAGACAAGAAGGGAGT GATT CGGGAAAGTTACCTCAAA 2200 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 19 8 0 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2201 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2260 

Qy 1981 ATGGGGGCCGTCTTCTCG 19 98 

II I I I I I I I I I II I I I I I 

Db 2261 ATGGGGGCCGTCTTCTCG 2278 
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Qy 


40 


CACTTTGCTGGGGCTGGTTTCCCAGAAGATTCTGAGCCAATCAGTATTTCGCATGGCAAC 
| I I I | 1 1 1 i 1 1 1 II 1 1 1 1 1 1 1 1 Mill 1 II 
CAGT T GAGGGCAGT CAG CT T T CCT GAAGAT GAT GAAC C C CT T AAT ACT GT C GAC TAT CAC 


99 


Db 


1 


60 


Qy 


100 


TAT ACAAAAC AGT AT C C GGT GT T T GT GGGC CACAAGC CAG GAC GGAACAC CAC ACAGAGG 

1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

TATTCAAGGCAATATCCGGTTTTTAGAGGACGCCCTTCAGG C AAT G AAT C G CAG 


159 


Db 


61 


114 


Qy 

Db 


160 
115 


CACAG GCT GGAC AT C C AGAT GAT TAT GAT CAT GAAC G GAAC CCT CT ACATT GCT GCT AGG 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 Ml 

CAC AGG CT GGACT T T CAGCT GAT GT T GAAAAT T C GAGACACACT T TAT AT T GCT GGCAGG 


219 
174 


Qy 


220 


GACCATATTTATACTGTTGATATAGACACATCACACACGGAAGAAATTTATTGTAGCAAA 

I I 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 M MMI 1 M 1 

GAT CAAGT T T AT AC AGT AAACT T AAAT GAAAT GC C C AAAAC AGAAGT AAT AC C CAAC AAG 


279 


Db 


175 


234 


Qy 


280 


AAACT GACAT GGAAAT CT AGACAGGC CGAT GTAGACACAT GCAGAAT G AAG G G AAAAC AT 
1 I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 
AAACT GACAT G GC GAT CAAGACAACAGGAT C GAGAAAACT GT GCT AT GAAAGGCAAG CAT 


339 


Db 


235 


294 


Qy 


340 


AAG GAT GAGT G C CACAACT T TAT T AAAGT T CT T CTAAAGAAAAACGAT GAT GCAT T GTTT 

1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II III 1 II 1 1 1 1 1 1 1 1 1 1 1 

AAAGAT GAAT GCCACAACTTT AT CAAAGTATTTGTT CCAAGAAACGAT GAGATGGTTTTT 


399 


Db 


295 


354 


Qy 


400 


GT CT GT GGAACTAATGCCTTCAACCCTT CCT GCAGAAACTATAAGATGGATACATT GGAA 
I I 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GT TT GT GGT AC CAAT GC ATT CAAT C C CAT GT GT AGAT AC T AC AGGTT GAGT AC CT T AGAA 


459 


Db 


355 


414 


Qy 


460 


C CAT T C GGGGAT GAAT T CAGC GGAAT GGC CAGAT G C CC AT AT GAT GCCAAAC AT GC CAAC 

I I I I I | | 1 1 II M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 III 1 1 1 1 
TATGATGGGGAAGAAATTAGT GGCCT GGCAAGAT GCCCATTT GAT GCCAGACAAAC CAAT 


519 


Db 


415 


474 


Qy 


520 


GT T GC ACT GTT T GC AGAT GGAAAACT AT ACT CAGC CAC AGT GACT GACT T C CT T GC CATT 

I I I I I II 1 M 1 1 1 1 1 1 1 II II M II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 

GTTGCCCTCTTTGCTGATGGGAAGCTGTATTCTGCCACAGTGGCTGACTTCTTGGCCAGC 


579 


Db 


475 


534 


Qy 


580 


GAC G CAGT CAT T T AC C GGAGT CT T G GAGAAAGCC CT AC C CT G CGGAC C GT CAAGCAC GAT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 1 1 M 
GAT GC CGT TAT T TAT CGAAGCAT GGGT GAT GGAT CT G C C CTT CGC ACAAT AAAAT AT GAT 


639 


Db 


535 


594 


Qy 


640 


T CAAAAT GGTT GAAAGAACCATACTTT GTT CAAGCCGTGGATTACGGAGATTATATCTAC 

|| | | | | M 1 1 1 1 M III MMI 1 1 1 1 Ml 1 II II III 1 III 1 1 1 1 

T CCAAAT GGATAAAAGAGCCACACTTTCTT CATGCCAT AGAATAT GGAAACTATGTCTAT 


699 


Db 


595 


654 


Qy 


700 


TTCTTCTT CAGGGAAAT AGCAGT GGAGTATAAC AC CAT GGGAAAG GT AGT TT T C C CAAGA 


759 



1 1 1 1 1 II I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I II 1111 III I I 



655 TTCTTCTTTC GAGAAAT CG CT GT C GAAC AT AAT AAT T TAGGCAAGG CT GT GT AT T C C CGC 714 

760 GTGGCTCAGGTTTGTAAGAATGATATGGGAGGATCTCAAAGAGTCCTGGAGAAACAGTGG 819 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

715 GTGGCCCGCATATGTAAAAACGACATGGGTGGTTCCCAGCGGGTCCTGGAGAAACACTGG 774 

820 ACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTC 87 9 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 I 1 1 1 1 1 1 1 

775 ACTTCATTTCTAAAGGCTCGGCTGAACTGTTCTGTCCCTGGAGATCCGTTTTTCTACTTT 834 

880 AACAT T CT C CAGGCAGT T ACAGAT GT GAT T CGT AT CAAC GGGC GT GAT GT T GT C CT GGC A 939 

I II I I I I I I I II I I I I I I I I I I I I I I I III II 

835 GAT GT T CT GCAGT CT ATT AC AGACATAAT ACAAAT CAAT G GCAT C C C CACT GT GGT C G GG 894 

94 0 ACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTT 999 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

895 GTGTTTACCACGCAGCTCAATAGCATCCCTGGTTCTGCTGTCTGTGCATTTAGCATGGAT 954 

1000 GACATT GC CAGT GTT T TT ACT GGGAGAT T CAAG GAACAGAAGT CT C CT GATT C CAC CT G G 1059 
I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I III 
955 GACATTGAAAAAGTATTCAAAGGAC GGTTTAAGGAACAGAAAACT CCAGATT CTGTTT GG 1014 

1060 ACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCC 1119 

I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 

1015 ACAGCAGTTCCCGAAGACAAAGTGCCAAAGCCAAGGCCTGGCTGTTGTGCAAAACACGGC 1074 

1120 T C CT T AGAAAGAT AT G CAAC CT C CAAT GAGTT C C CT GAT GAT ACC CT GAACT T CAT C AAG 1179 

Ml Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1075 CT TGC C GAAGCT T AT AAAAC CT C CAT CGATT T C C C GGAT GAAACT CT GT CAT T CAT CAAA 1134 

1180 AC GCAC C C GCT CAT GGAT GAG G CAGT GC C CT C CAT CTT CAAC AGGC CAT G GT T CCT GAGA 1239 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

1135 TCTCATCCCCTGATGGACTCTGCCGTTCCACCCATTGCCGATGAGCCCTGGTTCACAAAG 1194 

1240 AC AAT GGT CAGAT AC C G C CTT ACCAAAAT T GCAGT GGACACAGCT GCT GGG C CAT AT CAG 1299 

II I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1195 ACTC GGGT CAGGTACAGACTGACGGCCAT CT CAGT GGACCATT CAGCCGGACC CTACCAG 1254 

1300 AAT CAC ACT GT GGT T T T T CT GG GAT CAGAGAAGGGAAT CAT CTT GAAGT T T T T GGC CAGA 1359 

II I I II II I I I I I I I I I I I I I I I I III I I I I I I I 
1255 AACT ACACAGT CAT CTTT GTT GGCT CT GAAGCT GGCAT GGT ACTTAAAGTT CT GGC A 1311 

1360 AT AGGAAATAGT GGT TT T CT AAAT G AC AGC CT TT T CCT GGAGGAGAT GAGT GT T T ACAAC 1419 

I II I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I 

1312 AAGAC CAGT CCTTTCTCTTT GAAC GAC AGC GTAT TACT G GAAGAGATT GAAGC CT ACAAC 1371 

1420 T CT GAAAAAT GCAGCT AT GAT GGAGTCGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGAC 1479 

I I I I I I I I I I III I I I I I I I I II I I I M I I I I I I I I I 

1372 CAT G CAAAGT GCAGT GCT GAGAAT GAG GAAGACAAAAAGGT CAT CT CAT T ACAGT T GGAT 1431 

14 80 AGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGC 1539 

III I I I I I I I I I I II II I I I I I I I I I III I I I I I I I 

1432 AAAGATCACCACGCTTTATATGTGGCGTTCTCTAGCTGCATTATCCGCATCCCCCTCAGT 1491 

1540 C GGT GT GAAC GACAT GGGAAGT GT AAAAAAAC CT GTAT T G C CT C CAGAGAC C CAT AT T GT 1599 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II 

14 92 C GCT GT GAGC GT TAT G GAT CAT GT AAAAAGT CTT GTAT T GC AT CT C GT GAC C CGT AT T GT 1551 



Qy 1600 G GAT GGAT AAAGGAAGG 1616 

II IN III III 
Db 1552 GGCTGGTTAAGCCAGGG 1568 
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Sequence 5, Application US/09653274 
Patent No. 6635742 
GENERAL INFORMATION: 
APPLICANT: Boyle, Bryan J 
APPLICANT: Yeung, George Y 
APPLICANT: Arterburn, Matthew C 
APPLICANT: Mize, Nancy K 
APPLICANT: Tang, Y. Tom 
APPLICANT: Liu, Chenghua 
APPLICANT: Drmanac, Radoje T 

TITLE OF INVENTION: Methods and Maaterials Relating to Semaphorin-Like 
TITLE OF INVENTION: Polypeptides and Polynucleotides 
FILE REFERENCE: HYS-23 

CURRENT APPLICATION NUMBER: US/09/653,274 
CURRENT FILING DATE: 2000-08-31 
PRIOR APPLICATION NUMBER: 09/491,404 
PRIOR FILING DATE: 2000-01-10 
NUMBER OF SEQ ID NOS : 13 
SOFTWARE: PatentlnVer. 2.1 
SEQ ID NO 5 
LENGTH: 32 61 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-653-274-5 

Query Match 21.3%; Score 657.4; DB 4; Length 3261; 

Best Local Similarity 64.5%; Pred. No. 2.6e-171; 

Matches 1017; Conservative 0; Mismatches 551; Indels 9; Gaps 2; 

Qy 40 CACT TT GCT GGG GC T G GTT T C C C AGAAGAT T CT GAGC CAAT C AGT AT T T C G CAT GGCAAC 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4 9 CAGT T GAGG GCAGT C AG CTT T C CT GAAGAT GAT GAAC CC CT T AAT ACT GT C GACT AT CAC 108 

Qy 100 T AT ACAAAACAGT AT C C GGT GT T T GT GGGC CACAAG C C AGGAC GGAACAC CAC ACAGAGG 159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 109 TAT T CAAGGCAAT AT C C GGT TT T T AGAGGAC GC C CT T CAGG CAAT GAAT C GCAG 162 

Qy 160 CAC AGGCT G GACAT C C AGAT GAT TAT GAT CAT GAAC GGAAC C CT CT ACAT T GCT GCT AG G 219 

I I I I II I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I III 

Db 163 CAC AGGCTG GACT T T C AGCT GAT GT T GAAAAT T C GAGAC ACACT TT ATAT T GCT GG CAGG 222 

Qy 220 GAC CAT ATT TAT ACT GT T GATAT AGACAC AT CACAC AC GGAAGAAAT TT AT T GT AG CAAA 27 9 

I I I I I I I II I I II I III I III .1 I I I I I I I I 

Db 223 GAT C AAGT T T AT AC AGT AAACT T AAAT GAAAT G C C C AAAAC AGAAG T AAT AC C C AAC AAG 282 

Qy 280 AAACT GACAT GGAAAT C T AGAC AGG C C GAT GT AGAC ACAT GC AGAAT GAAGG GAAAACAT 339 

I I I I I I I I I I I I I I I I I I I I III I I I I II I I I I I II I I I I I 

Db 283 AAACT GACAT GGCGAT CAAGACAACAGGAT CGAGAAAACT GTGCTAT GAAAGGCAAGCAT 342 



Qy 340 AAGGATGAGT GCCACAACTTTATTAAAGTT CTT CTAAAGAAAAACGAT GAT GCATTGTTT 399 

I I I M I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I 

Db 343 AAAGAT GAAT G C C AC AAC T T TAT C AAAGT AT T T GT T C CAAGAAAC GAT GAGAT G GTTT T T 402 

Qy 400 GT CT GT GGAACT AAT GC C T T CAAC C CT T C C T GCAGAAACT AT AAGAT GGAT AC AT T GGAA 459 

I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I II I I I I I 

Db 4 03 GTT T GT G GT AC CAATGC AT T CAAT C C CAT GT GT AGAT ACT ACAGGT T GAGT AC CT T AGAA 462 

Qy 4 60 C CAT T C G GGGAT GAAT T C AGC GGAAT GGCCAGAT GC C CAT AT GAT G C CAAACAT GCCAAC 519 

I I I I I III III II I I I I I I I I I I I I I I I II I I I I I III I I I I 

Db 4 63 TAT GAT GGGGAAGAAAT T AGT GGC C T GGCAAGAT GC C CAT T T GAT GC CAGAC AAACCAAT 522 

Qy 520 GTT GCACT GT TTGCAGAT GGAAAACTATACT CAGCCACAGT GACT GACTT CCT T GCCATT 57 9 

I I I I I I I II I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I 

Db 523 GTTGCCCTCTTTGCTGATGGGAAGCTGTATTCTGCCACAGTGGCTGACTTCTTGGCCAGC 582 

Qy 580 GAC GCAGT CAT TT ACC GGAGT CT T GGAGAAAGC C CT AC CCT GC GGAC C GT CAAG CAC GAT 639 

II II M Mill I! II I I I I I I I I I I I I I I I I III I I I I 

Db 583 GAT GCC GTT ATTT AT C GAAGCAT GGGT GAT G GAT CT GC C CTT C GCACAAT AAAAT AT GAT 642 

Qy 640 T CAAAAT GGTT GAAAGAACCATACTTT GTT CAAGCCGT GGATTACGGAGATTAT ATCTAC 699 

II I I I I I I I I I I I I III I I I I I I I I I III I II II III I III I I II 
Db 643 T CCAAAT GGATAAAAGAGCCACACTTT CTT CAT GCCATAGAATAT GGAAACTAT GTCTAT 7 02 

Qy 7 00 TTCTTCTT CAG G GAAAT AGC AGT GGAGT AT AACAC CAT GGGAAAGGT AGT T T T C C CAAGA 759 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I III I I 
Db 7 03 TTCTTCTTTCGAGAAATCGCTGTCGAACATAATAATTTAGGCAAGGCTGTGTATTCCCGC 762 

Qy 7 60 GTGGCT CAGGTTT GTAAGAATGAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAACAGTGG 819 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I II I I I I I I I I 
Db 763 GTGGCCCGCATATGTAAAAACGACATGGGTGGTTCCCAGCGGGTCCTGGAGAAACACTGG 822 

Qy 820 ACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTC 879 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 823 ACTTCATTTCTAAAGGCTCGGCTGAACTGTTCTGTCCCTGGAGATCCGTTTTTCTACTTT 882 

Qy 8 80 AAC ATT CTCC AG G CAGTT ACAGAT GT GATT C GT AT CAACG GGC GT GAT GT T GT C CT GG CA 939 

I I I I I I I I I I I I I I I I I I I I I I I I I I III II 

Db 8 83 GAT GTT CT G C AGT CTAT T ACAGACAT AATACAAAT CAAT GGCAT C C C CACT GT GGT C G GG 942 

Qy 94 0 ACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTT 999 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 943 GT GT TT ACCAC GC AGC T CAATAGCAT C C CT G GT T CT GCT GT CT GT G C ATT TAGCAT GGAT 1002 

Qy 1000 GACATT GCCAGT GTTTTT ACTGGGAGATTCAAGGAACAGAAGTCT C CT GATTCCACCT GG 1059 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1003 GACATT GAAAAAGTATT CAAAGGACGGTTTAAGGAACAGAAAACTCCAGATTCT GTTT GG 10 62 

Qy 1060 ACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCC 1119 

I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1063 ACAGCAGTTCCCGAAGACAAAGTGCCAAAGCCAAGGCCTGGCTGTTGTGCAAAACACGGC 1122 

Qy 1120 TC CT T AGAAAGAT AT GCAAC CT C CAAT GAGTT C C CT GAT GAT AC CCT GAACTT C AT CAAG 1179 

III III I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1123 CT T GC C GAAGCT T AT AAAAC CT C CAT C GAT T T C C CGGAT GAAACT CT GT C ATT CAT CAAA 1182 

Qy 1180 AC GCAC C CG CT C AT GGAT GAGGC AGT G CC CT CC AT CT T CAACAGGC CAT GGTT CCT GAGA 1239 



I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I 

Db 1183 TCTCATCCCCTGATGGACTCTGCCGTTCCACCCATTGCCGATGAGCCCTGGTTCACAAAG 1242 

Qy 1240 ACAAT GGT C AGAT AC C GC CT T AC CAAAAT T G CAGT GGAC ACAGCT G CT GGGC CAT AT CAG 1299 

II I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1243 ACTCGGGTCAGGTACAGACTGACGGCCATCTCAGTGGACCATTCAGCCGGACCCTACCAG 1302 

Qy 130 0 AAT CACACT GT GGTTTTTCT GGGAT CAGAGAAG GGAAT CAT CT TGAAGT TTT T GGC CAGA 1359 

II I I I I II I I I I I I I I I I I I I I I I Ml I I I I I I I 

Db 1303 AACTACACAGTCATCTTTGTTGGCTCTGAAGCTGGCATGGTACTTAAAGTTCTGGC A 1359 

Qy 1360 ATAGGAAAT AGT GGT T T T CTAAAT GACAG C CT TT T C CT GGAGGAGAT GAGT GT T T ACAAC 1419 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1360 AAGAC CAGT CCTTTCTCTTT GAAC GACAGC GT AT T ACT GGAAGAGATT GAAG C CT ACAAC 1419 

Qy 142 0 T CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAG GAT CAT GGGCAT GCAGCT GGAC 14 7 9 

I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 142 0 CAT GCAAAGT GCAGT GCT GAGAAT GAGGAAGACAAAAAGGT C AT CT CAT T AC AGTT GGAT 1479 

Qy 14 8 0 AGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGC 1539 

III I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I 

Db 14 8 0 AAAGAT CAC CAC G CT T T AT ATGT GGC GTT CT CT AGCT G C ATT AT C C GCAT CC C C CT CAGT 1539 

Qy 1540 CGGTGT GAACGACAT GGGAAGT GTAAAAAAAC CT GTATTGCCT CCAGAGACCCATATTGT 1599 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1540 C GCTGT GAGC GTTAT GGAT CAT GT AAAAAGT C TT GT ATT G CAT CT C GT GAC C C GT AT T GT 1599 

Qy 1600 GGATGGATAAAGGAAGG 1616 

II III III III 

Db 1600 GGCTGGTTAAGCCAGGG 1616 



RESULT 4 
US-09-653-274-3 

Sequence 3, Application US/09653274 
Patent No. 6635742 
GENERAL INFORMATION: 
APPLICANT: Boyle, Bryan J 
APPLICANT: Yeung, George Y 
APPLICANT: Arterburn, Matthew C 
APPLICANT: Mize, Nancy K 
APPLICANT: Tang, Y. Tom 
APPLICANT: Liu, Chenghua 
APPLICANT: Drmanac, Radoje T 

TITLE OF INVENTION: Methods and Maaterials Relating to Semaphorin-Like 
TITLE OF INVENTION: Polypeptides and Polynucleotides 
FILE REFERENCE: HYS-23 

CURRENT APPLICATION NUMBER: US/09/ 653 , 27 4 
CURRENT FILING DATE: 2000-08-31 
PRIOR APPLICATION NUMBER: 09/491,404 
PRIOR FILING DATE: 2000-01-10 
NUMBER OF SEQ ID NOS : 13 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 3 
LENGTH: 3694 
TYPE: DNA 

ORGANISM: Homo sapiens 



FEATURE : 
NAME/ KEY: CDS 
LOCATION: { 434 )..( 3694 ) 
US-09-653-274-3 

Query Match 21.3%; Score 657.4; DB 4; Length 3694; 

Best Local Similarity 64.5%; Pred. No. 2.8e-171; 

Matches 1017; Conservative 0; Mismatches 551; Indels 9; Gaps 2; 

Qy 40 CACTTTGCTGGGGCTGGTTTCCCAGAAGATTCTGAGCCAATCAGTATTTCGCATGGCAAC 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4 82 CAGT T GAGGG C AGT CAGCTTT C CT GAAGAT GAT GAAC C CCT T AATACT GT C GACT AT C AC 541 

Qy 100 TATACAAAACAGTATCCGGTGTTTGTGGGCCACAAGCCAGGACGGAACACCACACAGAGG 159 

I! I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 542 TAT T CAAGGCAAT AT CC GGT T T TT AGAGGAC GCC CT T CAGG CAATGAATCGCAG 595 

Qy 160 CACAGGCT GGACAT CCAGAT GATTATGATCATGAACGGAACCCT CTACATTGCT GCTAGG 219 

, II I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I M II III 

Db 596 CACAGGCT GGAC T T T CAG CT GAT GT T GAAAAT T C GAGACAC ACT T TAT ATT G CT GGCAGG 655 

Qy 220 GACCATATTTATACT GTT GATATAGACACAT CACACACGGAAGAAATTTATTGTAGCAAA 279 

II I I I I I I I I I I I I III I III I I I I I I I I I 

Db 656 GAT C AAGT T T AT ACAGT AAACT T AAAT GAAAT GCC C AAAAC AGAAGT AAT AC C C AACAAG 715 

Qy 280 AAAC T GACAT GGAAAT CTAGACAG G CC GAT GT AGACAC AT GCAGAAT GAAGGGAAAAC AT 339 

I I I I M I I I I I I I I I I I I I I III I I I I II I II I I I I I I I I I 

Db 716 AAAC T GACAT GGC GAT CAAGACAACAGGAT C GAGAAAACT GT GCT AT GAAAGGCAAG CAT 775 

Qy 340 AAGGAT GAGT GC C ACAAC TT T ATTAAAGTT CT T CT AAAGAAAAAC GAT GAT GCAT T GTT T 399 

I I I I I I I M I I I I I I I I I I I I I I I M III I I I I I I I I I I I I I I 

Db 776 AAAGAT GAAT GC C ACAACTT T AT CAAAGT AT T T GT T C CAAGAAAC GAT GAGATGGTTT T T 835 

Qy 4 00 GT CT GT G GAACTAAT GC CTT CAAC C CTT C CT GCAGAAACT ATAAGAT GGAT ACATT GGAA 459 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 836 GTTT GTG GT AC CAAT GCAT T C AAT CC CAT GT GTAGAT ACTACAGGTT GAGT ACCTTAGAA 8 95 

Qy 4 60 CCATT CGGGGAT GAATT CAGCGGAATGGCCAGAT GCCCATAT GAT GCCAAACAT GCCAAC 519 

I I I I I III I II II MM I I I I I I I I I I I II II I II Ml MM 
Db 896 TAT GATGGGGAAGAAATTAGT GGC CTGGCAAGAT GCCCATTT GAT GCCAGAC AAAC CAAT 955 

Qy 520 GTT GCAC T GT TT GC AGAT GGAAAACTAT AC T CAGC CAC AGT GACT GACT T C CTT GC CAT T 579 

Mill II II II I I I II I II II II II II I I I I I I I I I I II II I I I I I I 
Db 956 GTTGCCCTCTTTGCTGATGGGAAGCTGTATTCTGCCACAGTGGCTGACTTCTTGGCCAGC 1015 

Qy 58 0 GACGCAGTCATTTACCGGAGTCTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGAT 63 9 

II I I M II II I I I I I I I I I I I M M II II M III I M I 

Db 1016 GAT GCC GT T AT TT AT C GAAG CAT GGGT GAT GGAT CT GC CCT T CGC ACAAT AAAAT AT GAT 1075 

Qy 640 T CAAAAT GGT T GAAAGAACCATACTTT GTT CAAGCCGT GGATTACGGAGATTATAT CT AC 699 

II II II I I I I I II I III I I I I I MM Ml I II II III I I II MM 
Db 1076 T CCAAAT GGAT AAAAGAGCCACACTTT CTT CATGCCATAGAATAT GGAAACTAT GTCTAT 1135 

Qy 700 TTCTTCTT CAGGGAAAT AGCAGT G GAGT AT AAC AC C AT GGGAAAGGT AGTT T T C C CAAGA 759 

I II I I I I I I II II I I I M I I II II I I II I I I I III I I 
Db 1136 TTCTTCTTTCGAGAAATCGCTGTCGAACATAATAATTTAGGCAAGGCTGTGTATTCCCGC 1195 



Qy 7 60 GT G GC T C AGGT T T GT AAGAAT GAT AT GG GAGGAT C T CAAAGAGT C CT GGAGAAACAGT G G 819 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1196 GTGGCCCGCATATGTAAAAACGACATGGGTGGTTCCCAGCGGGTCCTGGAGAAACACTGG 1255 

Qy 820 ACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTC 879 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 
Db 1256 ACTTCATTTCTAAAGGCTCGGCTGAACTGTTCTGTCCCTGGAGATCCGTTTTTCTACTTT 1315 

Qy 880 AAC AT T CT C C AGGCAGT T AC AGAT GT GAT T C GT AT CAACG GGCGT GAT GTT GT C CT GGCA 939 

I I I I I II f I I I I I I I I I II I I I I I I I I III II 

Db 1316 GAT GTT CT GC AGT CTAT T AC AGAC AT AAT ACAAAT CAAT G G CAT C CC CACT GT GGT C GGG 1375 

Qy 94 0 ACGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTT 999 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 137 6 GTGTTTACCACGCAGCTCAATAGCATCCCTGGTTCTGCTGTCTGTGCATTTAGCATGGAT 1435 

Qy 1000 GACATTGCCAGT GTTTTT ACT GGGAGATT CAAGGAACAGAAGTCT CCT GATT CCACCT GG 1059 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I III 
Db 1436 GACATTGAAAAAGTATT CAAAGGACGGTTTAAGGAACAGAAAACT CCAGATT CT GTTT GG 14 95 

Qy 1060 ACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCC 1119 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 96 ACAGCAGTTCCCGAAGACAAAGTGCCAAAGCCAAGGCCTGGCTGTTGTGCAAAACACGGC 1555 

Qy 1120 T C C T TAGAAAGAT AT GCAAC CT CCAAT GAGTT CC CTGAT GAT AC CCT GAACT T CAT CAAG 1179 

III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1556 CTT GC CGAAG CTT AT AAAAC CT CC AT C GATT T CC C GGAT GAAACT CT GT CAT T CAT CAAA 1615 

Qy 118 0 AC GCACC C GC T CAT GGAT GAGGCAGT GC C CT C CAT CTT CAACAGGCCAT GGT T C CT GAGA 1239 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1616 TCTCATCCCCTGATGGACTCTGCCGTTCCACCCATTGCCGATGAGCCCTGGTTCACAAAG 167 5 

Qy 124 0 ACAAT G GT CAGAT AC CGC CT T ACCAAAAT T G CAGT GGACAC AGCT GCT GGGC CAT AT CAG 1299 

II I I I I I I I I I I I I I I II III I I I I I I I I I I I I 

Db 1676 ACTCGGGTCAGGTACAGACTGACGGCCATCTCAGTGGACCATTCAGCCGGACCCTACCAG 1735 

Qy 1300 AAT CACACT GT GGT TTT T CT G GGAT CAGAGAAGGGAAT CAT CTT GAAGT TTT T G G C C AGA 1359 

II I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I 

Db 1736 AACTACACAGTCATCTTTGTTGGCTCTGAAGCTGGCATGGTACTTAAAGTTCTGGC A 1792 

Qy 1360 ATAGGAAATAGT GGTTTT CTAAATGACAGCCTTTT CCT GGAGGAGAT GAGTGTTTACAAC 1419 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1793 AAGAC CAGT C CT TTCTCTTT GAAC GAC AGC GT AT TACT GGAAGAGAT T GAAGC CT ACAAC 1852 

Qy 1420 T CT GAAAAAT GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GGGC AT GCAGCT GGAC 147 9 

I I I II I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1853 CAT GCAAAGT GCAGT GCT GAGAAT GAG GAAGACAAAAAGGT CAT C TC ATTACAGT T GGAT 1912 

Qy 1480 AGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGC 1539 

III I I II I I I I I I I I I I II II II I II III I I I I I I I 

Db 1913 AAAGAT C AC C ACGCT TTAT AT GT GGCGT T CT CT AGCT G CAT TAT C CG C AT C C CC CT CAGT 1972 

Qy 154 0 C GGT GT GAAC GAC AT GGGAAGT GTAAAAAAAC CT GTAT TG C CT C CAGAGAC C CAT AT T GT 1599 

MINIMI I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I 

Db 1973 CGCTGTGAGCGTTATGGATCATGTAAAAAGTCTTGTATTGCATCTCGTGACCCGTATTGT 2032 

Qy 1600 GGAT GGAT AAAGGAAGG 1616 



II III IN III 

Db 2033 GGCTGGTTAAGCCAGGG 2049 



RESULT 5 

US-09-833-381-920/C 

; Sequence 920, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 

FILE REFERENCE: 5800-119 
; CURRENT APPLICATION NUMBER: US/09/833, 381 
; CURRENT FILING DATE: 2001-04-11 
; PRIOR APPLICATION NUMBER: 09/516,448 

PRIOR FILING DATE: 2000-02-29 
; NUMBER OF SEQ ID NOS : 2050 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 92 0 

LENGTH: 84 6 

TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-833-381-920 

Query Match 19.5%; Score 604; DB 4; Length 846; 

Best Local Similarity 100.0%; Pred. No. 6.9e-157; 

Matches 604; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I | | | | I I I I I I I II I I I I I I II I I I I I I I I 1 I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 604 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 545 

Qy 61 CCAGAAGATT CTGAGCCAAT CAGTATTT CGCAT GGCAACT ATACAAAACAGTAT CCGGTG 120 

I I I I I I I I I M I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 544 CCAGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT G GCAACT AT ACAAAAC AGT AT C C GGT G 485 

Qy 121 TT T GT GGGC C ACAAGC CAGGAC GGAACAC C ACACAGAGGC ACAGGCT GGACAT C CAGAT G 18 0 

I M | | I I I I I M I I I I I I I I I I I I I I I M I II M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 84 TTT GTGGGCCACAAGC CAGGAC GGAACAC C ACACAGAGGC ACAGGCT GGACATCCAGATG 42 5 

Qy 181 AT TAT GAT CAT GAAC GGAAC CCT CT ACAT T GCT GCT AGGGAC CAT AT T TAT ACT GT T GAT 24 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 424 ATT AT GAT CAT GAAC GGAAC CCT CT ACAT T GCT G CT AGGGAC CAT AT T TAT ACT GT T GAT 365 

Qy 241 AT AGACACAT CACAC AC GGAAGAAAT T T ATT GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I | M | I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 364 AT AGACACAT CACAC AC GGAAGAAATTT AT T GT AGCAAAAAACT GACAT G GAAAT CT AGA 305 



301 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGT GCCACAACTTT 360 

I I I I I I I M I I II M I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I 

304 CAGGCC GAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 24 5 

361 ATTA7VAGTTCTTCTAAAGA7U\AACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 42 0 

| I I I M I I I I I I I I II I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I II I I 

24 4 ATT AAAGT T C T T CT AAAGAAAAACGAT GAT G CAT T GT T T GT CT GT GGAAC TAAT GC CTT C 18 5 

421 AAC CCTTCCTG C AGAAACTAT AAGAT GGATACAT T GGAAC CAT T CGG GGAT GAATT CAGC 48 0 



Db 


184 


Qy 


481 


Db 


124 


Qy 


541 


Db 


64 


Qy 


601 


Db 


4 



I I I M M I I i I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I 

AACCCTTCCT GCAGAAACTATAAGAT GGATACATT GGAACCATTCGGGGAT GAATT CAGC 125 
GGAAT G GC CAGAT GC C CAT AT GAT G C CAAAC AT GC CAAC GTT GCACT GTT T GCAGAT G GA 540 

I I I I I I I I M I I I I II I I I I M M I I I I I I I II I M I I I I I I I I I I I I I II I I I I I I I I I 

G GAAT GGC CAGAT GC C CAT AT GAT GC CAAAC AT GC CAAC GT T GCACT GT T T GCAGAT G GA 65 



600 



I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I 



I I I I 
CTTG 



RESULT 6 

U5-09-077-940A-3 

; Sequence 3, Application US/09077940A 

; Patent No. 6576441 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru et al . 

; TITLE OF INVENTION: NOVEL SEMAPHORIN Z AND GENE ENCODING THE SAME 
; FILE REFERENCE: 0020-4426P 

; CURRENT APPLICATION NUMBER: US/09/077, 940A 

; CURRENT FILING DATE: 1998-06-05 

; NUMBER OF SEQ ID NOS: 20 

; SOFTWARE: Patentln version 3.1 

; SEQ ID NO 3 

; LENGTH: 3524 

; TYPE: DNA 

; ORGANISM: Homo sapiens 

; FEATURE : 

NAME/ KEY: 5 1 UTR 

LOCATION: (1) . . (38) 
; OTHER INFORMATION: 

NAME/ KEY: 3'UTR 
; LOCATION: (2706) . . (3524 ) 
; OTHER INFORMATION: 

NAME/ KEY: CDS 

LOCATION: (39).. (2702) 
; OTHER INFORMATION: 
US-09-077-940A-3 

Query Match 18.0%; Score 555.4; DB 4; Length 3524; 

Best Local Similarity 60.0%; Pred. No. 4.3e-143; 

Matches 1026; Conservative 0; Mismatches 656; Indels 27; Gaps 5; 

Qy 13 GCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTCCCAGAAGATTCT 72 

II I I I I I II I I II I I M I I I II I I I I I 

Db 72 GCCCTGCTGCTTCTGCTGCTGCTACTGGGGGGCGCCCACGGCCTCTTTCCTGAGGACCCG 131 

Qy 73 GAGCCAATCAGTATTTCGCATGGCAACTATACAAAACAGTATCCGGTGTTTGTGGGCCAC 132 

I I I III I II I MM I I I I I II I I I I I I I M I M I I I 

Db 132 CCGCCGCTTAGCGTGGCCCCCAGGGACTACCTGAACCACTATCCCGTGTTTGTGGGCAGC 191 



Qy 



133 AAG CC AGGAC GGAAC AC C AC ACAGAG GCAC AGGCT GG AC AT CC AGAT GAT TAT G 18 6 



MINIM I I I I I II II I I I I I I I I I M 

Db 192 G GGC C CG GAC G C CT GAC C CC C GC AGAAGGT GC T GAC GAC CT CAAC AT C CAGC GAGT C CT G 251 

Qy 187 AT CAT GAACGGAACCCT CTACATT GCT GCTAGGGACCATATTTAT ACTGTT GATATAGAC 24 6 

I I I I I I I I I I I I I I I I I I II I I I III II I I I I I 

Db 252 CGGGTCAACAGGACGCTGTTCATTGGGGACAGGGACAACCTCTACCGCGTAGAGCTGGAG 311 

Qy 247 ACAT CACACACGGAAGAAATTTATT GT AGCAAAAAACT GAC ATGGAAAT CTAGACAGGCC 306 

II I III I I I I I II I I I II I I I I I I I I 

Db 312 C C C C C CAC GT C CACGGAGCT G C GGT AC C AGAGGAAGCT GAC CT GGAGAT CTAAC C C CAGC 371 

Qy 307 GAT GT AGACAC AT GCAGAAT GAAGG GAAAAC AT AAGGAT GAGT GC CACAACT TT AT T AAA 366 

II I I I I II I I I I I I I I I I I I I I III I I I I I I MM! Ill 
Db 372 GACATAAACGT GTGT CGGAT GAAGGGCAAACAGGAGGGCGAGTGT CGAAACTTCGTAAAG 431 

Qy 367 GTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTCAACCCT 426 

I I I I M M I I I I I I I I I I I I I I I I I II I I I I M I I 

Db 432 GTGCTGCTCCTTCGGGACGAGTCCACGCTCTTTGTGTGCGGTTCCAACGCCTTCAACCCG 491 

Qy 427 T CCT GC AGAAACT ATAAGAT GGAT ACATT GGAAC CAT T C GG GGAT GAATT C AGC GGAAT G 4 86 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 492 GT GT GC G C CAACT ACAG CAT AGACAC C CT GCAGC C CGT CGGAGACAAC AT CAGC G GT AT G 551 

Qy 4 87 GCC AGAT GCC CAT AT GAT GC CAAAC AT GC CAAC GT T GCACT GTT T GCAGAT GGAAAAC T A 546 

I I I I I I I I I I I I I 11111111111111111111 I I I I I I II 
Db 552 GCCCGCTGCCCGTACGACCCCAAGCACGCCAATGTTGCCCTCTTCTCTGACGGGATGCTC 611 

Qy 547 TACT CAGCCACAGT GACT GACTT C CTT GCCATT GACGCAGT CATTTACCGGAGT CTTGGA 606 

I I I I I I II II II I I II I I I I I I I I I II I II I I I I I I I I I I II II II 

Db 612 TTCACAGCTACTGTTACCGACTTCCTAGCCATTGATGCTGTCATCTACCGCAGCCTCGGG 671 

Qy 607 GAAAGC C CT ACCCT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC CAT ACT TT 666 

II || || I I I I II I I I I I I I II II II M M I I I I I I I I I I II I I I I I I 

Db 672 GACAGGCCCACCCTGCGCACCGTGAAACATGACTCCAAGTGGTTCAAAGAGCCTTACTTT 731 

Qy 667 GT T CAAGCC GT GGATT AC GGAGAT TAT AT CT ACT T CTT CT T CAGG GAAAT AGC AGT GGAG 726 

II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 7 32 GTCCATGCGGTGGAGTGGGGCAGCCATGTCTACTTCTTCTTCCGGGAGATTGCGATGGAG 791 

Qy 727 T AT AAC ACCAT GGGAAAGGT AGT T TT C C CAAGAGT G GCT C AGGTT T GT AAGAAT GAT AT G 786 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 7 92 TT T AACT AC C T GGAGAAGGT GGT G GT GT C C C GC GT GGC C C GAGT GT GCAAGAAC GAC GT G 851 

Qy 787 GGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGACGT CGTT CCTGAAGGCGCGCTT GAAC 84 6 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 852 GGAGGCTCCCCCCGCGTGCTGGAGAAGCAGT GGACGT CCTT CCT GAAGGCGCGGCT CAAC 911 

Qy 847 T G CT C AGTT C CT G GAGACT CT C AT T T T TAT T T CAAC AT T CT CC AGG C AGT T AC AGAT GT G 906 

I II I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

Db 912 TGCTCTGTACCCGGAGACTCCCATTTCTACTTCAACGTGCTGCAGGCTGTCACGGGCGTG 971 

Qy 907 ATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAACAGCATC 966 

I | II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 972 GTCAGCCTCGGGGGCCGGCCCGTGGTCCTGGCCGTTTTTTCCACGCCCAGCAACAGCATC 1031 

Qy 967 CCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACTGGGAGA 102 6 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 



Db 



1032 CCTGGCTCGGCTGTCTGCGCCTTTGACCTGACACAGGTGGCAGCTGTGTTTGAAGGCCGC 1091 



Qy 1027 T T CAAGGAAC AGAAGT CT CCT GATT CC ACC T GGACAC CAGT T C CT GAT GAAC GAGTT C C T 108 6 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1092 TTCCGAGAGCAGAAGTCCCCCGAGTCCATCTGGACGCCGGTGCCGGAGGATCAGGTGCCT 1151 

Qy 1087 AAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACCTCCAAT 114 6 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1152 CGACCCCGGCCCGGGTGCT GCGCAGCCCCCGGGATGCAGTACAATGCCTCCAGC 1205 

Qy 1147 GAGT T C C CTGAT GAT AC C CT GAACT T CAT CAAGAC GCACC C GCT CAT G GAT GAGGCAGT G 1206 

I II II MIM I Ml I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 
Db 1206 GCCTTGCC GGAT GACAT C CT CAACT TT GT CAAGAC C CACC C T CT GAT G GAC GAGGCGGT G 1265 

Qy 1207 CCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTTACCAAA 1266 

I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 12 66 CCCTCGCTGGGCCATGCGCCCTGGATCCTGCGGACCCTGATGAGGCACCAGCTGACTCGA 1325 

Qy 12 67 ATT GCAGT GGACAC AGCT GCT GGG C CAT AT CAGAAT C ACACTGT GGT T TT T CT G GGAT C A 132 6 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1326 GTGGCTGTGGACGTGGGAGCCGGCCCCTGGGGCAACCAGACCGTTGTCTTCCTGGGTTCT 1385 

Qy 1327 GAGAAGGGAAT CAT CT T GAAGTT T T T GGCCAGAATAGGAAATAGTGGTTTTCTA 138 0 

I I I I I I I I I I I II I I I I I I I II II 

Db 1386 GAGGCGGGGACGGTCCTCAAGTTCCTCGTCCGGCCCAATGCCAGCACCTCAGGGACGTCT 1445 

Qy 1381 AAT GAC AGC CT TT T CCT GGAGGAGAT GAGT GTT T ACAACT CT GAAAAAT GC AG C 1434 

III I I I I I I I I I I I I I III I I I I II I I 

Db 1446 G GGCT CAGT GT CT T C CT GGAG GAGT T T GAGACC T AC C GGC C GGACAGGTGT G GAC GGC CC 1505 

Qy 1435 TAT GAT GGAGT CGAAGACAAAAGGAT CATGGGCAT GCAGCT GGACAGAGCAAGCAGCT CT 1494 

I I I I I II I III I I I I I I I I I I I I I I II I I 

Db 1506 GGCGGTGGCGAGACAGGGCAGCGGCTGCTGAGCTTGGAGCTGGACGCAGCTTCGGGGGGC 1565 

Qy 14 95 CTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACAT 1554 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 

Db 1566 CTGCTGGCTGCCTTCCCCCGCTGCGTGGTCCGAGTGCCTGTGGCTCGCTGCCAGCAGTAC 1625 

Qy 1555 GGGAAGT GTAAAAAAAC CT GTATT GC CT C CAGAGAC C CAT ATT GT GGATGGAT AAAGGAA 1614 

I I I I I I I I I II I I I I I I II I I I II I I I I II I II 

Db 1626 TCGGGGTGTATGAAGAACTGTATCGGCAGTCAGGACCCCTACTGCGGGTGGGCCCCCGAC 1685 

Qy 1615 GGTGGTGCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAG 167 4 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1686 GGCT CCTGCATCTTCCTCAGCCCGGGCACCAGAGCCGCCTTTGAGCAGGACGTGTCC 1742 

Qy 1675 CGTGGCAATACAGATGGTCTGGGGGACTG 1703 

I I II II II I I I I I I I M 

Db 1743 GGGGCCAGCACCTCAGGCTTAGGGGACTG 1771 



RESULT 7 

US-09-077-940A-1 ■ 

; Sequence 1, Application US/09077940A 

; Patent No. 6576441 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru et al . 



; TITLE OF INVENTION: NOVEL SEMAPHORIN Z AND GENE ENCODING THE SAME 
; FILE REFERENCE: 0020-4426P 

; CURRENT APPLICATION NUMBER: US/09/077 , 94 OA 
; CURRENT FILING DATE: 1998-06-05 
; NUMBER OF SEQ ID NOS : 20 

SOFTWARE: Patentln version 3.1 
; SEQ ID NO 1 

LENGTH: 3692 

TYPE: DNA 
; ORGANISM: Rattus norvegicus 

FEATURE: 

NAME/ KEY: 5'UTR 

LOCATION: (1) . . (18) 

OTHER INFORMATION: 

NAME/ KEY: CDS 
; LOCATION: (19).. (2682) 
; OTHER INFORMATION: 

NAME/KEY: 3*UTR 

LOCATION: (2683) .. (3653) 

OTHER INFORMATION: 
; NAME/KEY: polyA_site 
; LOCATION: ( 3654 )..( 3692 ) 

OTHER INFORMATION: 
US-09-077-940A-1 

Query Match 17.7%; Score 546.8; DB 4; Length 3692; 

Best Local Similarity 60.3%; Pred. No. l.le-140; 

Matches 1006; Conservative 0; Mismatches 632; Inciels 30; Gaps 5; 
Qy 57 TTTC C CAGAAGATTCT GAGCCAAT CAGT ATTT CGCATGGCAACT ATACAAAACAGTATCC 116 



Db 



99 TTTCCCAGATGAACCACCTCCACTCAGTGTGGCTCCCAGGGACTACCTGAGCCACTACCC 158 



QY 



Db 



117 GGTGTTTGTGGGCCACAAGCCAGGACGGAACACCACACAGAGGC ACAGGCTGGA 17 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I 

159 CGTGTTCGTGGGCAGCGGGCCTGGTCGTCTGACCCCTGCAGAGGGTGCTGAGGACCTCAA 218 



Qy 



171 CATCCAGAT GATTAT GAT CAT GAACGGAACCCTCTACATTGCT GCTAGGGACCAT ATTTA 230 



Db 



219 CAT C C AGAGAGT GCT AC GT GT T AAC AGGACACT GT T CAT CGGGGACAGAGACAAC CT GT A 27 8 



QY 



Db 



231 TACT GTT GAT AT AGACACAT CACACACGGAAGAAAT TTATTGT AGCAAAAAACT GACAT G 290 

I I I I I I I II I I I III II I I I I I I I I 

27 9 CCAAGTAGAACTGGAGCCATCCACATCCACGGAGCTGCGGTATCAGCGGAAGCTTACCTG 338 



Qy 



Db 



291 GAAAT CTAGACAGGCCGAT GT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT G 350 

I III I II III II I I I I I I I I I I I I I I II I I I I I I 

339 GC GCT CCAAC C C CAGT GACAT C GAT GT GT GT C GGAT GAAGGGCAAGCAAGAG G GT GAGT G 398 



Qy 



351 C CACAACTT T AT TAAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GTTT GT CT GT GGAAC 410 



Db 



399 TCGGAACTTTGTCAAGGTGCTCCTGCTTCGTGACGAATCCACGCTCTTCGTGTGCGGCTC 458 



Qy 

Db 



411 
459 



470 
518 



Qy 471 T GAATT CAGC GGAAT GGC C AGAT GCC CAT AT GAT GC CAAACAT G CCAAC GT T GCACT GT T 530 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I I M I I I I I I I I I I I I I I 
Db 519 CAACATCAGTGGTATGGCCCGCTGCCCCTACGACCCCAAGCATGCCAATGTCGCCCTCTT 57 8 

Qy 531 T GCAGAT GGAAAACTATACT CAGC CACAGT GACT GACTT CCTT GCCATT GACGCAGT CAT 590 

I I II I 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 579 CT C AGAT GG GAT GC T CT T C ACAG C CACAGT AAC T GACT T C C T AGCC AT C GACGCT GT T AT 638 

Qy 591 TTACCGGAGTCTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTT 650 

I I I I I II I I I I I II I II II II I I I II II I I I I I II II II I I I I I 
Db 639 CTACCGTAGCCTTGGGGACCGGCCCACACTGCGCACAGTAAAGCATGACTCCAAGTGGTT 698 

Qy 651 GAAAGAAC CAT AC T T T GT T CAAGC CGT GGAT TAC GGAGAT T AT AT CT ACTT CT T CTT CAG 710 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I II II I I I I I I I 

Db 699 TAAAGAGCCATACTTTGTGCATGCGGTGGAGTGGGGAAGCCACGTCTACTTCTTCTTCCG 758 

Qy 711 GGAAATAGCAGTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGT 770 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 759 GGAGATCGCCATGGAGTTTAACTATCTGGAAAAGGTGGTGGTGTCCCGTGTGGCCCGTGT 818 

Qy 771 T T GT AAGAAT GAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GTT C CT 830 

II I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I II Mill 

Db 819 ATGCAAGAATGATGTGGGCGGCTCCCCACGGGTGCTGGAGAAGCAGTGGACTTCCTTCCT 878 

Qy 831 GAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCA 890 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I 
Db 879 GAAGGCCCGGCTCAACTGCTCCGTGCCTGGGGACTCACACTTCTACTTCAATGTACTGCA 938 

Qy 8 91 GGCAGTTACAGATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTAC 950 

III II II I MM I I I I I I II I II I I I II II II I I 

Db 939 GGCTGTGACTGGTGTGGTGAGCCTTGGCGGCCGTCCAGTGATTCTTGCTGTCTTCTCAAC 998 

Qy 951 AC CT TATAAC AGC AT C C CT G G GT CT GC AGT CT GT GC CTAT GAC AT GCT T GACAT T GC CAG 1010 

III II I I II I M I I I II I I I I II II I I I I I I I I I II II I III 

Db 999 TCCTAGCAACAGCATCCCTGGCTCAGCTGTCTGTGCCTTTGACATGAACCT^AGTGGCTGC 1058 

Qy 1011 T GT T TTT ACT G GGAGAT T CAAGGAACAGAAGT CT C CT GAT T CC AC CT GGAC AC CAGTT CC 1070 

I I I I I I M I II I I I I II I II I II II I I I I I I I I I I I I I I I II I I 
Db 1059 T GT GTT T GAAG GC C GCT T CC GGGAGCAGAAGT CAC CT GAGT CAAT CT GGAC C C C AGT GCC 1118 

Qy 1071 T GAT GAAC GAGTT C CT AAGC C CAGGC C AGGT T G CT GT GCT GGCT CAT C CT C CT T AGAAAG 1130 

I I I I I I II I I I I I I I I II II I I I I I I II I III II 

Db 1119 T GAG GAC CAAGTAC CAC GGC C CAG GC C C GGGT G CT GT G CAGCGCCCGGTATGCA 1172 

Qy 1131 AT AT GCAAC CT C CAAT GAGTT CC C T GAT GATACC CT GAACT T CAT CAAGAC G CAC CC GCT 1190 

M I I II I I II I I I I I I I I I I I II I I I I II I I I I II I I I I 

Db 1173 GTACAAC GCAT CCAAT GCCCTTCCT GAC GAGATT C T CAACT T T GT AAAGAC C C AC CCACT 1232 

Qy 1191 CAT GGAT GAG G CAGT GC C CT C CAT CTT CAACAGGC CAT GGT T C C T GAGAACAAT GGT CAG 1250 

II II I I I I I I I I I I I I II I I I I I I I II I I I II M I I Ml I 
Db 1233 GAT GGAC GAAG CGGT GCCCTCCCT GG GC CACT C GC CT T GGATT GT GAGAACT CT GAT AC G 1292 

Qy 1251 ATAC CGCCTTACCAAAAT TGCAGT GGACACAGCT GCTGGGCCATATCAGAAT CACACT GT 1310 

II I II II I I I II I I I I I I I II II I I II I II II II I 

Db 1293 GCAC CAGCTGACCC GAGT GGCTGT GGAT GT GGGT GCAGGCCCAT GGGGCAAT CAGACAAT 1352 

Qy 1311 GGT T TT T CT GGGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GGCCAGAATAGG 1364 



Db 1353 AGTCTTCCTTGGCTCTGAGGTTGGCACAGTCCTCAAATTCCTTGTGAAGCCCAATGCCAG 1412 

Qy 1365 AAAT AGT GGT T TT CT AAATGACAG CCTTTTCCTG GAG GAGAT GAGT GT TT A 1415 

II I II I I I I I I I I I I M I I I I 

Db 1413 TGTCTCAGGGACCACAGGGCCCAGCATCTTTTTGGAGGAGTTTGAGACCTACCGGCCAGA 1472 

Qy 1416 CAACTCT GAAAAAT GCAGCTATGAT GGAGT CGAAGACAAAAGGAT CATGGGCAT GCAGCT 1475 

II I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 

Db 1473 CAGGTGTGGACGATCCAGCAGTGCTGGTGAGTGGGGACAACGACTTCTGAGCCTGGAGCT 1532 

Qy 14 76 GGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCT 1535 

II II I III I I I 11 I I I I I I I II I I I I I I I 

Db 1533 AGATGCTGCCTCAGGTGGCCTGCTGGCAGCCTTCCCCCGCTGTGTGGTTCGTGTTCCTGT 1592 

Qy 1536 T GGCCGGT GT GAAC GACATGGGAAGTGTAAAAAAAC CT GT ATT GCCT CCAGAGAC CCATA 1595 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 15 93 T GCCC GCT GC CAGCTGT ACT CGGGGTGCAT GAAGAACT GCATT GGCAGCCAAGAT CCATA 1652 

Qy 1596 T T GT GGAT GGAT AAAGGAAGGT GGT GC CT GCAG C CAT T TAT CAC C CAACAGCAGACT GAC 1655 

I I I I I I I II III I I I I I I I I III I I I I II 

Db 1653 CTGCGGGTGGGCCCCCGA TGGCTCCTGCATCTTCCTCAGACCAGGAACCAGTGCCAC 1709 

Qy 1656 T TT T GAGCAG GACATAGAGC GT GGCAAT ACAGAT GGT CT GG GGGACT G 1703 

I I I I I I I I I I I I I I I II III I I I I I I I I 

Db 1710 GTTTGAGCAAGATGTGTCCGGGGCCAGCACCTCTGGCTTAGGTGACTG 1757 



RESULT 8 
US-09-254-594-5 

; Sequence 5, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 

; FILE REFERENCE: 0020-4527P 

; CURRENT APPLICATION NUMBER: US/ 09/254 , 5 94 

; CURRENT FILING DATE: 1999-05-11 

; NUMBER OF SEQ ID NOS : 13 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 5 

; LENGTH: 27 90 

; TYPE: DNA 

ORGANISM: Homo sapiens 

FEATURE : 

NAME /KEY: mis c_f eature 
LOCATION: ()..() 

OTHER INFORMATION: Tissue Type: Child Brain 
NAME/ KEY: CDS 
LOCATION: (1) . . (2790) 

OTHER INFORMATION: Identification Method: E 
NAME /KEY: miscjeature 
LOCATION: ()..() 

; OTHER INFORMATION: Identification Method: P for resulting peptide 
US-09-254-594-5 



Query Match 14.3%; Score 443.6; DB 4; Length 2790; 

Best Local Similarity 58.6%; Pred. No. 3.1e-112; 

Matches 84 9; Conservative 0; Mismatches 584; Indels 15; Gaps 4; 

Qy 164 GGCT GGACAT CCAGAT GATTATGATCAT GAACGGAACCCTCTACATT GCT GCTAGGGACC 223 

I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 179 GGCTGGACTTTCAGAGATTCCTGACCTTGAACCGGACCTTGCTAGTGGCTGCCCGGGATC 238 

Qy 224 ATATTT ATACT GTTGAT ATAGACACAT CACACACGGAAGAAATTTATT GTAGCAAAAAAC 283 

I I I I I I I I I I I I II III I I I I I 

Db 239 ACGTTTTCTCCTTCGATCTTCAAGCCGAAGAAGAAGGGGAGGGGCTGGTGCCCAACAAGT 298 

Qy 284 T GACAT GGAAAT CTAGACAGG C C GAT GT AGACAC AT GCAGAAT GAAGG GAAAAC AT AAGG 343 

I III III I I I I I I I I II I I I I I I I I III 

Db 299 ATCTA ACATGGAGAAGCCAAGAT GT GGAGAACT GT GCT GT ACGGGGAAAGCTGACGG 355 

Qy 344 AT GAGT G CCACAACT T T ATTAAAGTT CT T C TAAAGAAAAAC GAT GAT G CAT T GT T T GT CT 403 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 356 ATGAGTGCTACAACTATATTCGTGTTCTTGTTCCCTGGGACTCCCAGACGCTCCTTGCCT 415 

Qy 4 04 GT GGAACT AAT GC CT T CAAC C CT T CCT GC AGAAACT AT AAGAT GGAT AC AT T GGAAC CAT 463 

M I I I I I I I I I I I I I I I I I I I I I I I I I III II I I I I 
Db 416 GTGGAACGAACTCATTCAGCCCTGTGTGCCGCAGCTATGGGATAACTTCGCTGCAGCAGG 475 

Qy 4 64 T C GGGGAT GAATT CAGC GGAAT GGCCAGAT GCC C AT AT GAT GC C7^AACAT G CCAAC GTT G 523 

I I I I I I I I I I I I III II I I I I I I I I I I I I I I II I I I I I I I I 
Db 476 AGGGT GAGGAACT GAGT GGGCAGGCT C GAT GCCCCTTT GAT GC C AC C CAGT CCAAC GT GG 535 

Qy 524 CACT GTTTGCAGAT GGAAAACTATACT CAGCCACAGT GACT GACTT CCTT GCCATTGACG 583 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
Db 536 CCATCTTTGCAGAGGGCAGCCTGTACTCAGCCACAGCTGCGGATTTCCAGGCCAGTGATG 595 

Qy 584 CAGT C AT TT AC C GGAGT CTT GGAGAAAGC C CT AC CCT GCGGAC C GT CAAGCAC GATT CAA 643 

III II I I I I I I I II I I II I II I I III MM I II II I 

Db 596 CTGTAGTTTACAGAAGCCTTGGGCCCCAGCCCCCACTCCGCTCCGCCAAGTATGACTCCA 655 

Qy 644 AAT GGTT GAAAGAACCATACTTTGTTCAAGCCGT GGATTACGGAGATTATATCTACTT CT 703 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 656 AGT GGCT C C GAGAGCCACACT TT GT C CAGG C CT T GGAG CAT GGAGAC CAT GT CT ACT T CT 715 

Qy 7 04 T C T T CAGGGAAAT AGC AGT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T C C CAAGAGT GG 763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 716 TCTTCCGCGAGGTCTCTGTGGAGGATGCTCGGCTGGGGAAGGTGCAGTTCTCCCGCGTAG 775 

Qy 7 64 CT C AG GT TT GTAAGAAT GAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT 823 

II I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I 

Db 776 CCCGAGTATGTAAACGTGACATGGGCGGCTCGCCTCGGGCCTTGGACCGCCACTGGACAT 835 

Qy 824 CGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACA 883 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I II I II II I I I I 

Db 836 CCTTCCTGAAGCTTCGGCTCAACTGCTCTGTCCCTGGGGACTCTACTTTCTATTTTGATG 895 

Qy 884 TTCTCCAGGCAGTTACAGATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGT 943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 896 TTTTACAGGCCTTGACTGGGCCTGTGAACCTGCATGGCCGCTCTGCTCTCTTTGGGGTCT 955 

Qy 944 TT T CT ACAC CT T ATAACAG CAT C C CT GGGT CT GCAGT CT GT GC CTAT GAC AT GC T T GACA 10 03 



I I I I I . I I I I M I I I I II I I I I I I II II I I I I I I I I I I I I I 

Db 956 TCACCACCCAGACCAATAGCATCCCTGGCTCTGCCGTCTGCGCCTTCTACCTGGATGAGA 1015 

Qy 1004 TT G CC AGT GT TT T TACT GGGAGATT CAAG GAAC AGAAGT CT C CT GAT TC C AC CT GGACAC 1063 

III III III III I I I I I I I I I I I I I II III I I I I I I I I 

Db 1016 TTGAGCGTGGGTTTGAGGGCAAGTTCAAGGAGCAGAGGAGTCTGGATGGGGCCTGGACTC 1075 

Qy 1064 CAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCT 1123 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 107 6 CT GT GT CT GAG GACAGAGTT CC CT CAC CC AGG C CAG GAT C CT GT GC AGGAGT AGG GGGAG 1135 

Qy 1124 T AGAAAGAT AT G CAAC CT C CAAT GAGT T C C CT GAT GATAC CCT GAACTT CAT CAAGAC G C 1183 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1136 CTGCCTTGTTCTCCTCTTCCCGAGACCTCCCTGATGATGTCCTGACCTTCATCAAGGCTC 1195 

Qy 1184 ACCCGCTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAA 1243 

I I I I I I I I I I I I I I I I I I I I II III. I I I I I 

Db 1196 ACCCGCTGCTGGACCCCGCTGTACCACCTGTCACCCATCAGCC TCTACTCACTCTCA 1252 

Qy 1244 T G GT C AGAT AC C GCCT T AC CAAAATT GC AGT G GAC ACAGCT GCT GGGCC ATAT C AGAAT C 1303 

Ml II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1253 CT AGCAGG GC C C TACT GAC C CAAGT AGCT GT GGAT GG C AT GGCT GGT CC C CAC AGT AAC A 1312 

Qy 1304 AC ACT GTGGT T T T T CT GG GATC AGAGAAG GGAAT CAT CT T GAAGT T T TT G GC C AGAAT AG 1363 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1313 TCACAGTCATGTTCCTTGGCTCCAATGATGGGACAGTGCTGAAGGTGCTGACCCCAGGTG 1372 

Qy 1364 GAAAT AGT GGTT TT CT AAAT GACAGC CTT T T C CT G GAGGAGAT GAGT GTT T ACAACT CT G 1423 

I II I III II I I I I I I I I I I I I II I I I I I I I I 

Db 1373 GGCGATCCGG GGGACCT GAGCC CAT C CT C CT GGAAGAGAT TGAT GC CTAC AG C C CT G 1429 

Qy 142 4 AAAAAT GCAGCT ATGAT GGAGT C G AAGACAAAAG GAT CAT G GGCAT GCAGCT GG 14 77 

I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1430 C C C G GT GCAGT G GGAAGC GGAC AGC C CAAACAG CAC GAC G GAT CAT AG GGCT GGAG CT GG 14 89 

Qy 147 8 ACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTG 1537 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 90 ACACTGAGGGTCACAGGCTTTTTGTGGCTTTTTCTGGCTGTATTGTCTACCTCCCTCTCA 1549 

Qy 1538 GC C G GT GT GAAC GAC ATGGGAAGT GTAAAAAAAC CT GT ATT GC CT C CAGAGAC CC AT AT T 1597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1550 GCCGGTGTGCCCGGCATGGGGCCTGTCAGAGGAGCTGTTTGGCTTCTCAGGACCCATACT 1609 

Qy 1598 GTGGATGG- 1605 

I I I I I I I I 

Db 1610 GTGGATGG 1617 



RESULT 9 
US-09-254-594-4 

; Sequence 4, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 
; FILE REFERENCE: 0020-4527P 



; CURRENT APPLICATION NUMBER: US/09/254 , 594 
; CURRENT FILING DATE: 1999-05-11 
; NUMBER OF SEQ ID NOS : * 13 

SOFTWARE: Patentln version 3.0 
; SEQ ID NO 4 

LENGTH: 3432 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 

NAME/KEY: misc_f eature 

LOCATION: ()..() 
; OTHER INFORMATION: Tissue Type: Child Brain 

NAME/ KEY : 5'UTR 
; LOCATION: (1) . . (187) 

; OTHER INFORMATION: Identification Method: E 
; NAME/KEY: mi sc_f eature 

LOCATION: ( 188 ).. (2977 ) 
; OTHER INFORMATION: CDS; Identification Method: E 
; NAME/ KEY: 3'UTR 
; LOCATION: ( 2978 )..( 3407 ) 

OTHER INFORMATION: Identification Method: E 

NAME/KEY: polyA_signal 

LOCATION: ( 3408 )..( 3432 ) 
; OTHER INFORMATION: Identification Method: E 
US-09-254-594-4 

Query Match 14.3%; Score 443.6; DB 4; Length 3432; 

Best Local Similarity 58.6%; Pred. No. 3.5e-112; 

Matches 849; Conservative 0; Mismatches 584;- Indels 15; Gaps 4; 

Qy 164 G GCT GGAC AT C C AGAT GAT TAT GAT CAT GAAC GGAACC CT CT ACAT T GCT GCT AGGGAC C 223 

I I I I I I I I I I I I I I III I I I I I I I III I I I I I I I I I I I I 

Db 366 GGCT G GAC T TT CAGAGAT T C CT GAC CTT GAAC C GGACCT T GCT AGT GG CT G C C CG GGAT C 425 

Qy 224 AT AT T TAT ACT GT T G AT AT AGAC AC AT C AC AC AC G GAAGAAAT T TAT T GT AGC AAAAAAC 283 

I I I I I I I I I I I I II III I I I M 

Db 426 ACGTTTTCTCCTTCGATCTTCAAGCCGAAGAAGAAGGGGAGGGGCTGGTGCCCAACAAGT 4 85 

Qy 284 T GAC AT GGAAAT CT AGACAGGC C GAT GT AGACACAT GC AGAAT GAAGGGAAAACAT AAGG 34 3 

I III II I I I I I I I I I II I I I I I II I III 

Db 48 6 ATCTA ACAT GGAGAAGCCAAGAT GT GGAGAACTGT GCT GTACGGGGAAAGCT GACGG 542 

Qy 344 AT GAGTGC CACAACT T TAT TAAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GTT T GT CT 403 

I I M I I I I I I I I I I I I I I I I I I II I II I I I Mill 

Db 543 ATGAGTGCTACAACTATATTCGTGTTCTTGTTCCCTGGGACTCCCAGACGCTCCTTGCCT 602 

Qy 4 04 GT GGAACTAAT GCCTTCAACCCTT CCTGCAGAAACTATAAGAT GGAT ACAT T GGAACCAT 4 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
Db 603 GT GGAAC GAAC T CAT T CAGCC CT GT GT GC CG CAG CT AT G GGATAACTT C GCT G C AGCAGG 662 

Qy 4 64 T C G GGGAT GAAT T CAGC G GAAT GGC CAGAT GC CC AT AT GAT GCCAAACAT G C CAAC GT T G 523 

I I I I I II I I I I I III II II I I I I I I I I I I I I II I I I I I I I I 
Db 663 AGGGT GAG GAACT GAGT GGGCAGG CT C GAT GC CC CT T T GAT GC C AC C CAGT C CAAC GT GG 722 

Qy 524 CACT GT T T GCAGAT G GAAAACT AT ACT C AGC CAC AGT GACT GACTT C C T T GC CAT T GAC G 583 

I I I I II I I I I II I I I II I I I I I I I I I I I I II II Ill 

Db 723 C CAT CTT T GCAGAGGGC AGC CT GT ACT CAGC CAC AGCT GC GGAT T T C CAGGC CAGT GAT G 7 82 



584 CAGT CAT T T AC CGGAGT CT T GGAGAAAGC C CT AC C CT G CGGAC C GT CAAGCAC GAT T CAA 643 

III I I I M I I I I I I I I II Mill I I I I II I I I I I I I 

783 CTGTAGTTTACAGAAGCCTTGGGCCCCAGCCCCCACTCCGCTCCGCCAAGTATGACTCCA 842 

644 AAT G GT T GAAAGAACC AT ACT T T GT T C AAGC C GT G GAT T AC GGAGAT T AT AT CT ACT T CT 703 

I I I I I I I I I I I I M I I I I I I I I I I I I I I II I II I I I I I I I I I I I 
843 AGT GG CT C C GAGAGCC ACACT TT GT CCAGG C CT T GGAGC AT GGAGAC CAT GT CT ACT T CT 902 

704 T CT T CAGGGAAAT AGC AGT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T C C CAAGAGT GG 763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

903 TCTTCCGCGAGGTCTCTGTGGAGGATGCTCGGCTGGGGAAGGTGCAGTTCTCCCGCGTAG 962 

7 64 CT C AGGT T T GT AAGAAT GAT AT G G GAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT 823 

I II MM I I I I I I I I I I I I I I I I I I II I I I I I I I I 

963 CCCGAGTATGTAAACGTGACATGGGCGGCTCGCCTCGGGCCTTGGACCGCCACTGGACAT 1022 

824 CGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACA 883 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
1023 CCTTCCTGAAGCTTCGGCTCAACTGCTCTGTCCCTGGGGACTCTACTTTCTATTTTGATG 1082 

884 TT CT C CAGGCAGT TAC AGAT GT GAT T C GT AT CAACGG GC GT GAT GT T GT C CT GGCAAC GT 943 

I I I II I I I I I I I I I I I I I I I I I I I I I I 

1083 TTTTACAGGCCTTGACTGGGCCTGTGAACCTGCATGGCCGCTCTGCTCTCTTTGGGGTCT 1142 

944 TTT CTACAC CTTATAACAGCAT CCCT GGGT CTGCAGTCTGT GCCTAT GACATGCTT GACA 1003 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1143 TCACCACCCAGACCAATAGCATCCCTGGCTCTGCCGTCTGCGCCTTCTACCTGGATGAGA 1202 

1004 TT G CCAGT GT TT T TACT GGGAGATT CAAGGAACAGAAGT CT C CT GAT T C C AC CT GGACAC 1063 

I M Ml M I III I I I I I I I I I I I I I II Ml I I I I I I I I 

12 03 TTGAGCGTGGGTTTGAGGGCAAGTTCAAGGAGCAGAGGAGTCTGGATGGGGCCTGGACTC 1262 

1064 CAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCT 1123 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1263 C T GT GT CT GAGGACAGAGT T C C CT CAC C C AGGC CAGGAT C CT GT GC AGGAGT AGGGG GAG 1322 

1124 T AGAAAGAT AT GCAACCT CCAAT GAGTTCCCT GATGATACCCT GAACTT CAT CAAGACGC 1183 

I | I I I M II I I I I I I I I I I I I I I I I I II M I I I I I I I 

1323 CTGCCTTGTTCTCCTCTTCCCGAGACCTCCCTGATGATGTCCTGACCTTCATCAAGGCTC 1382 

1184 AC C C GCTC AT GGAT GAGGCAGT G CC CT C C AT CTT CAACAGGC CAT G GT T C CT GAGAACAA 1243 

I I I I I I I I I I I I I I I I I I II II Ml I I I I I 

1383 ACCCGCTGCTGGACCCCGCTGTACCACCTGTCACCCATCAGCC TCTACTCACTCTCA 1439 

1244 T GGT CAGAT AC C G C CT TAC CAAAAT T GC AGT G GAC ACAG C T GCT GG GC CAT AT CAGAAT C 1303 

Ml II I I I I I I I I I I I I I I I I II I I I I I II 

14 4 0 CTAGCAGGGCCCTACTGACCCAAGTAGCTGTGGATGGCATGGCTGGTCCCCACAGTAACA 14 99 

1304 ACACT GTGGTTTTTCT GGGAT CAGAGAAG GGAAT C AT CT T GAAGT T TTT GGC CAGAAT AG 1363 

Mill I I I I I I I I I I I I I I I I I I I I I I.I I I I I 
1500 T CAC AGT C ATGT TCCTTGGCTC CAAT GAT GG GACAGT GCT GAAG GT GCT GAC C CC AGGT G 1559 

1364 GAAAT AGT G GT T T T CT AAAT GACAGC CT T TT C CT GGAGGAGAT GAGT GT T T ACAACT CT G 1423 

I || I III II I I I I I II I I I I I II I I I I I I I I 

1560 GGCGATCCGG G GGACCTGAGC C CAT C CT C CT GGAAGAGAT T GAT GC CT ACAGC CCT G 1616 



Qy 1424 AAAAAT GCAGCT AT GAT GGAGT C G AAGACAAAAGGAT CAT GGG CAT G CAGCT GG 14 77 

M I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1617 CC C G GT G CAGT G GGAAGCG GACAGCC CAAACAGCAC GAC GGAT CAT AGG G CT GGAGCT G G 167 6 

Qy 1478 ACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTG 1537 

III I I I II I III II II III I I I I I I I I I I I I 

Db 1677 ACACTGAGGGTCACAGGCTTTTTGTGGCTTTTTCTGGCTGTATTGTCTACCTCCCTCTCA 17 36 

Qy 1538 GC C GGT GT GAAC GAC AT GGGAAGT GT AAAAAAAC CT GT AT T G C CT C CAGAGAC C CAT AT T 1597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1737 GCCGGTGTGCCCGGCATGGGGCCTGTCAGAGGAGCTGTTTGGCTTCTCAGGACCCATACT 17 96 

Qy 1598 GTGGATGG 1605 

I II II I I I 
Db 1797 GTGGATGG 1804 



RESULT 10 
US-09-254-594-2 

Sequence 2, Application US/09254594 
Patent No. 6566094 
GENERAL INFORMATION: 
APPLICANT: KIMURA, Toru 
APPLICANT: KIKUCHI, Kaoru 

TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 
FILE REFERENCE: 0020-4527P 
CURRENT APPLICATION NUMBER: US/ 09/254 , 594 
CURRENT FILING DATE: 1999-05-11 
NUMBER OF SEQ ID NOS : 13 
SOFTWARE: Patentln version 3.0 
SEQ ID NO 2 
LENGTH: 2787 
TYPE: DNA 

ORGANISM: Rattus norvegicus 
FEATURE : 

NAME/KEY : misc_f eature 
LOCATION: ()..() 

OTHER INFORMATION: Tissue Type: Brain 
NAME/KEY: CDS 
LOCATION: (1) . . (2787) 

OTHER INFORMATION: Identification Method: E 
NAME /KEY: mis cofeature 
LOCATION: (}..() 

OTHER INFORMATION: Identification Method: P for resulting peptide 
US-09-254-594-2 

Query Match 12.0%; Score 369.8; DB 4; Length 2787; 

Best Local Similarity 55.9%; Pred. No. 7.8e-92; 

Matches 811; Conservative 0; Mismatches 622; Indels 18; Gaps 5; 

Qy 164 G GCT G GAC AT C CAGAT GAT TAT GAT CAT GAAC GGAACC CT CT ACAT T GCT G C T AGGGAC C 223 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 17 6 GGCTGGACTTTCAGAGATTCCTGACCTTGAACCGGACCTTGCTTGTGGCTGCCCGGGATC 235 

Qy 224 ATATTTATACT GTT GAT ATAGACAC AT CACACAC GGAAGAAATTT ATT GTAGCAAAAAAC 2 83 

I I I I I I I I I I I I II III I I I I I 

Db 236 ACGTTTTCTCCTTCGATCTTCAAGCCCAAGAAGAAGGGGAGGGGCTGGTGCCCAACAAGT 295 



2 84 T GAC AT GGAAAT CT AGACAGGC CGAT GT AGACAC AT GCAGAAT GAAG GGAAAAC AT AAGG 343 

I I I I I I I I I II I I I I I I I I I I I I I I 

2 96 T T CT GAC AT GGC G GAGC CAAGACAT GGAGAAT T GT GCT GT C C GG GGAAAG CT GAC GG 352 

344 AT GAGT GC CACAACT TT ATTAAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT T T GT CT 403 

I I I M I I I I I I I II I I I II I I II I III I I I I I 

353 ACGAATGCTACAACTACATCCGTGTTCTTGTTCCCTGGGACTCGCAGACACTCCTTGCCT 412 

4 04 GT GGAACTAAT GC CT T CAAC C CT T C CT GCAGAAACT ATAAGAT G GAT ACAT T G GAAC CAT 463 

I I I II I I I I I I I I II I I I I I II I I I I I I III I I I I I I 

413 GTGGAACAAATTCCTTCAGCCCTGTGTGTCGCAGCTATGGGATAACATCTCTGCAACAGG 472 

464 T CGG GGAT GAAT T C AG C GGAAT G GC CAGAT G CC CAT AT GAT GC CAAACAT GC CAACGT T G 523 

I I I I I I I I I I I II I I II I I I I I I I I I I I I II II I III 

473 AGGGTGAGGAGCTGAGTGGGCAAGCTCGATGCCCCTTTGATGCCACCCAGTCCACTGTGG 532 

524 CACT GT T T GC AGAT GGAAAACT AT ACT CAGC CAC AGT GACT GACT T C CTT GC C AT T GACG 583 

I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I 
533 C CAT CT CT GC AGAGGGT AGT T T GT ACT CAGC CAC AGCAGC AGAT T T C CAGGC C AGT GAT G 592 

584 CAGTCATTTACCGGAGTCTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAA 643 

III I I I II I I I I I I II I II I I I I I II I I I I I I I I I 

593 CTGTGGTTTACAGAAGCCTTGGACCTCAGCCCCCACTCCGTTCTGCAAAGTATGACTCCA 652 

644 AAT GGTT GAAAGAACCATACTTT GTT CAAGCCGT GGATTACGGAGATTATAT CTACTT CT 703 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

653 AGT GGCTT CGAGAGCCACACTTTGTCT ATGCTTT GGAGCAT GGAGAC CAT GT CTACTT CT 712 

7 04 T CT T CAG GGAAAT AGCAGT GGAGT AT A ACAC CAT GGGAAAG GT AGTT T T C C CAAGAG 760 

II I I I I I I I I I I I I I I I I I I I I I I I I 

713 TTCTTCCGGAGAAGTCTCTGTGGAGGACGCCCGGCCTGGGGAGGGTGCAGTTTTCCCGGG 772 

7 61 T G GCT CAGGT T TGT AAGAAT GAT AT GGGAGGAT CTCAAAGAGT C CT GGAGAAAC AGT G GA 820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

773 TGGCCCGGGTGTGTAAACGTGACATGGGTGGCTCACCACGGGCCTTGGATCGCCACTGGA 832 

821 CGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCA 880 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

833 CATCCTTCCTTAAGCTGAGGCTCAACTGCTCCGTCCCTGGGGACTCTACCTTCTACTTTG 892 

881 ACAT T CT CCAGG C AGT T AC AGAT GT GAT T C GT AT CAACG GGC GT GAT GTT GT C CT GGCAA 94 0 

I I I I I I I I I I I I I I I I I I I II I I I I 

893 ATGTCTTACAGTCCTTAACTGGGCCTGTGAACCTGCATGGGCGCTCTGCCCTCTTTGGGG 952 

941 CGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTG 1000 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 

953 T C T T CAC T ACT C AGAC CAAT AG CATT C CT G GGT CT GCAGT CTGCGCCTT CT AC CT AGATG 1012 

1001 ACAT T G C CAGT GT T T T T ACT GGGAGAT T CAAGGAAC AGAAGT CT CCT GAT T CC AC CT GGA 1060 

I I I I I I III III III I I I I I I I I I I I I I II III I I I I I I 

1013 AC ATT GAAC GT GGCT T T GAG GG CAAGT T CAAGGAGC AGAGGAGT CT GGAT GGGGCCT GGA 1072 

1061 CACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCT 1120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1073 CTCCTGTGTCTGAGGACAAAGTCCCCTCACCCAGGCCAGGGTCCTGTGCAGGTGTGGGTG 1132 



Qy 1121 C CT T AGAAAGAT AT GCAAC CT CCAAT GAGT T C C CT GAT GAT AC C C T GAACT T CAT CAAGA 118 0 

I I II I I I I I III I I I I I I I I I I I I I I I I I I I I I II 

Db 1133 CAGCTGCCTTATTCTCCTCCTCTCAAGACCTGCCTGACGATGTCCTGCTCTTCATCAAGG 1192 

Qy 1181 CGCACCCGCTCATGGATGAGGCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAA 124 0 

I I I I II I I I I I I I I I I I I I I I III II I I I I I 

Db 1193 CACACC C ACT G CT GGAT C C C GCT GT G C CAC C TGCCACCCATCAACCTCTCCTCACTC 124 9 

Qy 1241 CAAT GGT CAGAT AC C GC CTT ACCAAAAT T GCAGT GGACAC AGCT GCT GGGC CAT AT C AGA 1300 

I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1250 TGACTAGCAGGGCTCTACTGACCCAGGTAGCTGTGGATGGTATGGCTGGCCCCCACAGAA 1309 

Qy 1301 ATC ACAC TGTGGTTTTT CT GGGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GGC CAGAA 1360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1310 ATACTACAGTCCTGTTTCTTGGCTCCAATGATGGGACAGTGCTGAAGGTGCTACCTCCAG 1369 

Qy 1361 TAGGAAATAGT GGT T T T CT AAAT GACAGCCT TTT C CT GGAGGAGAT GAGT GT T T ACAACT 1420 

I I I I II I II I I I I I I I I I I I II Mill 

Db 1370 GGGGACA GTCT CT GGGACCC GAGCCTAT CATATT GGAAGAGATT GATGCCT ACAGCC 1426 

Qy 1421 C T GAAAAAT GCAGCT AT GAT G G AGT CGAAGACAAAAG GAT CAT GGGC AT GC AGC 1474 

II I I I I I II II I I I I I I I I I I I I I I I 

Db 1427 ATGCCCGGTGCAGTGGGAAGCGGTCACCCCGAGCTGCTCGACGGATCATAGGGCTGGAGC 1486 

Qy 1475 TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 1534 

I I I I I I I I I I I I I I I I I I I II II I I I I II 

Db 14 87 TGGACACTGAGGGTCACAGGCTTTTTGTGGCCTTTCCTGGATGCATCGTCTACCTCTCTC 154 6 

Qy 1535 T T GGCC G GT GT GAACGACAT G G GAAGT GT AAAAAAAC CT GT AT T GC CT CCAGAGACC C AT 1594 

I I I I I I I I I I I I I I I I Mill I I I I I I I II I I II I I I 

Db 1547 TCAGCCGCTGTGCCCGGCATGGAGCATGTCAGAGGAGCTGCCTGGCTTCTCTGGACCCAT 1606 

Qy 1595 AT T GT GGAT G G 1605 

I II I II I I I I 

Db 1607 ACT GT G GAT GG 1617 



RESULT 11 
US-09-254-594-1 

; Sequence 1, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 
; FILE REFERENCE: 0020-4527P 

CURRENT APPLICATION NUMBER: US/ 09/254 , 594 
CURRENT FILING DATE: 1999-05-11 
; NUMBER OF SEQ ID NOS : 13 
; SOFTWARE: Patentln version 3.0 
; SEQ ID NO 1 

LENGTH: 3195 . 

TYPE: DNA 
; ORGANISM: Rattus norvegicus 

FEATURE: 

NAME/KEY: misc__f eature 
LOCATION: ()..() 



OTHER INFORMATION: Tissue Type: Brain 
NAME/ KEY: 5'UTR 
LOCATION: (1) . . (50) 

OTHER INFORMATION: Identification Method: E 
NAME/ KEY: misc_feature 
LOCATION: (51) . . (2 837) 

OTHER INFORMATION: CDS; Identification Method: E 
NAME/KEY: 3'UTR 
LOCATION: (2838) . . (3195) 

OTHER INFORMATION: Identification Method: E 
US-09-254-594-1 

Query Match 12.0%; Score 369.8; DB 4; Length 3195; 

Best Local Similarity 55.9%; Pred. No. 8.5e-92; 

Matches 811; Conservative 0; Mismatches 622; Indels 18; Gaps 5; 

Qy 164 GGCT GGACAT CCAGAT GATTATGAT CAT GAACGGAACCCT CTACATT GCT GCTAGGGAC C 223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 226 GGCTGGACTTTCAGAGATTCCTGACCTTGAACCGGACCTTGCTTGTGGCTGCCCGGGATC 285 

Qy 224 AT ATT TAT ACT GT T GAT AT AGAC ACAT CACACAC GGAAGAAAT T TAT T GT AGCAAAAAAC 283 

I Ml I I I I I I I I II I M I M I I 

Db 2 86 ACGTTTTCTCCTTCGATCTTCAAGCCCAAGAAGAAGGGGAGGGGCTGGTGCCCAACAAGT 345 

Qy 284 T GACAT GGAAAT CT AGACAGGCC GAT GT AGACACAT G CAGAAT GAAGG GAAAACAT AAGG 343 

I | I I I I I I I II I I I I I I I I I I I I I I 

Db 346 T T CT GACAT GGCG GAG C CAAGACAT G GAGAAT TGTGCTGTCCG G GGAAAG CT GAC GG 402 

Qy 344 AT GAGT GC C ACAACTT T AT TAAAGTT CT T C T AAAGAAAAAC GAT GAT GCAT T GT T TGT CT 403 

I I I I I I I I I I I I II I I I I I I I II I Ml I I I I I 

Db 4 03 ACGAATGCTACAACTACATCCGTGTTCTTGTTCCCTGGGACTCGCAGACACTCCTTGCCT 462 

Qy 404 GT GGAACT AAT GC CTT CAAC C CT T CCT GCAGAAACT ATAAGAT GGAT ACAT T GGAAC CAT 463 

I I I I I I I I I I I I I II I I I I I II I I I I I I III I I I I I I 

Db 463 GTGGT^ACAAATTCCTTCAGCCCTGTGTGTCGCAGCTATGGGATAACATCTCTGCAACAGG 522 

Qy 464 TC GGGGAT GAATT CAG C GGAAT GG CCAGAT GC C CAT AT GAT GC CAAACAT GCCAAC GTT G 523 

I I I I I I I I I I I II I I I I I I 1 I I I I I I I I I II Ml Ml 

Db 523 AGGGT GAGG AGCT GAGT GG GCAAGCT C GAT G C C C CT TT GAT GC CAC C CAGT CC ACT GT GG 582 

Qy 524 CACT GT T T GCAGAT GGAAAACT AT ACT CAGC CACAGT GACT GACTT C CT T GCC AT T GAC G 583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I 
Db 583 CC AT CT CT GCAGAGGGT AGT T T GT ACT CAG C CAC AG CAGC AGATT T C CAGG CCAGT GAT G 642 

Qy 584 CAGTCATTTACCGGAGTCTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAA 643 

III II I I I I I I I I I I I I II I I I II II I I I I I I I I I 

Db 643 CTGTGGTTTACAGAAGCCTTGGACCTCAGCCCCCACTCCGTTCTGCAAAGTATGACTCC^ 702 

Qy 644 AAT GGTT GAAAGAACCATACTTT GTT CAAGCCGTGGATTACGGAGAT TAT ATCTACTT CT 703 

I I I I I I I I I I I I I II I I I III I I I I I I II I I I I I I I I I I I I I 
Db 703 AGT GGCT T C GAGAGC C AC ACTT T GT CT AT G CT TT GGAGCAT GGAGAC CAT GT CT ACT T CT 762 

Qy 704 T C T T CAGG GAAATAG CAGT GGAGTAT A ACAC CAT GGGAAAGGT AGT T T T C C CAAGAG 760 

|| | | | I I I I I I I I I I II I I I I I I I I I 

Db 7 63 TTCTTCCGGAGAAGTCTCTGTGGAGGACGCCCGGCCTGGGGAGGGTGCAGTTTTCCCGGG 822 



QY 



761 T GGCT CAGGTTT GTAAGAAT GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGA 820 



Db 


823 


TGGCCCGGGTGTGTAAACGTGACATGGGTGGCTCACCACGGGCCTTGGATCGCCACTGGA 


882 


Qy 


821 


CGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCA 

1 II Mill III 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 1 M 1 1 1 1 1 1 M II II 
i ii i i i i i iii i i i i i i i i i i i ii i i i i i i i i i i i ii 

CATCCTTCCTTAAGCTGAGGCTCAACTGCTCCGTCCCTGGGGACTCTACCTTCTACTTTG 


880 


Db 


883 


942 


Qy 


881 


ACAT T CT CCAGG CAGT T AC AGAT GT GAT T C GT ATCAAC G GGC GTGAT GT T GT C CT GGCAA 

1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 
i t i iii i i i i i i i i i i i i i ii 

ATGTCTTACAGTCCTTAACTGGGCCTGTGAACCTGCATGGGCGCTCTGCCCTCTTTGGGG 


940 


Db 


943 


1002 


Qy 


941 


CGTTTTCTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTG 

II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 Ml II 
ii i i i i i ii i i i i i i i i i i i i i i i i i i i i i i i i i i ii ■ ■• 

T CTT CACTACT CAGACCAATAGCATT C CT GGGT CT GCAGT CT GCGCCT T CT ACCT AGAT G 


1000 


Db 


1003 


1062 


Qy 


1001 


ACAT T GC CAGT GTT T T TACT GGGAGAT T CAAG GAACAGAAGT C T C CT GATT CCAC CT GGA 

1 1 1 1 1 1 III III 111 1 1 1 1 1 1 II 1 1 1 1 1 II III 1 1 1 1 1 1 
i i i i i i iii iii ii i i i i i ■ i i i i i i i i ii iii 

ACATTGAACGTGGCTTTGAGGGCAAGTTCAAGGAGCAGAGGAGTCTGGATGGGGCCTGGA 


1060 


Db 


1063 


1122 


Qy 


1061 


CACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCT 

1 II 1 i 1 1 1 1 II III II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 
1 ii ii i t i i ii iii ii i i i i i i t i i i i i i i i i i i ii 

CTCCTGTGTCTGAGGACAAAGTCCCCTCACCCAGGCCAGGGTCCTGTGCAGGTGTGGGTG 


1120 


Db 


1123 


1182 


Qy 


1121 


CCTT AGAAAGATATGCAACCT CCAATGAGTT CCCT GAT GAT ACCCTGAACTT CAT CAAGA 

1 1 II 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i | ii i i i i i i ii i i i i i i iii i i i i i i i i i i i i i i 

CAGCTGCCTTATTCTCCTCCTCTCAAGACCTGCCTGACGATGTCCTGCTCTTCATCAAGG 


1180 


Db 


1183 


1242 


Qy 


1181 


C GC AC C C GCT CAT GGAT GAGGC AGT GC C CT C CAT CTT CAACAGGC CAT GGT T CCT GAGAA 

I 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 Ml II 1 1 1 1 1 

CACACCCACT GCT GGAT CCCGCTGTGCCACC TGCCACCCATCAACCTCTCCTCACTC 


1240 


Db 


1243 


1299 


Qy 


1241 


CAAT GGT CAGAT AC C GC C TT AC CAAAAT T GCAGT GGACAC AGCT GCT GGG C CAT AT CAGA 

1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i iii i i i i i i i iiiiiiii i i i i i i i i i 

T GAC T AGCAG G GCT CT ACT GACC CAGGTAGCT GT G GAT GGT AT G GCT GGC C C C C ACAGAA 


1300 


Db 


1300 


1359 


Qy 


1301 


AT C ACACT GT GGT T T TT CT GGGAT C AGAGAAGG GAAT CAT CTT GAAGT TT T T GGC CAGAA 

I ( Mil t | | 1 | ! 1 | [ | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

II i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

ATACTACAGT CCT GTTT CTT GGCT C CAAT GAT GGGACAGT GCT GAAGGTGCTAC CTC CAG 


1360 


Db 


1360 


1419 


Qy 


1361 


TAGGAAATAGT GGTTTT CTAAAT GACAGCCTTTT CCT GGAGGAGAT GAGT GTTT ACAACT 

1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 
I I I I ii i ii i i i i i i i i i t i ii 'iii 

GGGGACA GT CT CT GGGACCCGAGCCT AT CATATTGGAAGAGATT GAT GCCTACAGCC 


1420 


Db 


1420 


1476 


Qy 


1421 


CT GAAAAAT GC AGCT AT GAT GG AGT CGAAGACAAAAGGAT CAT GGGCATGCAGC 

II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mill 
ii 1 i i i i i i i i i i i i i i i i i i i i i i i 

ATGCCCGGTGCAGTGGGAAGCGGTCACCCCGAGCTGCTCGACGGATCATAGGGCTGGAGC 


1474 


Db 


1477 


1536 


Qy 


1475 


TGGACAGAGCAAGCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCC 

I I M 1 1 1 1 1 || | Ml II II II II 1 1 1 1 M 

TGGACACTGAGGGTCACAGGCTTTTTGTGGCCTTTCCTGGATGCATCGTCTACCTCTCTC 


1534 


Db 


1537 


1596 


Qy 


1535 


T T GGC C GGT GT GAAC GACAT GG GAAGT GT AAAAAAAC CT GT AT T G C CT C CAGAGAC C CAT 

I MM MM 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 II II M M II 1 

TCAGCCGCTGTGCCCGGCATGGAGCATGTCAGAGGAGCTGCCTGGCTTCTCTGGACCCAT 


1594 


Db 


1597 


1656 


Qy 


1595 


ATTGTGGATGG 1605 





I 1 1 1 1 1 1 1 1 1 



Db 



1657 ACTGTGGATGG 1667 



RESULT 12 
US-09-833-381-112 

Sequence 112, Application US/09833381 
Patent No. 6672186 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
FILE REFERENCE: 5800-119 

CURRENT APPLICATION NUMBER: US/ 09/ 833 , 38 1 
CURRENT FILING DATE: 2001-04-11 
PRIOR APPLICATION NUMBER: 09/516,448 
PRIOR FILING DATE: 2000-02-29 
NUMBER OF SEQ ID NOS : 2 050 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 112 
LENGTH: 591 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/ KEY : mi s c_f ea t ur e 
LOCATION: (1) . . . (591) 
OTHER INFORMATION: n = A,T,C or G 
US-09-833-381-112 

Query Match 11.9%; Score 368; DB 4; Length 591; 

Best Local Similarity 90.2%; Pred. No. le-91; 

Matches 415; Conservative 0; Mismatches 42; Indels 3; Gaps 2; 

ACT CAC CT GACAGCAC AGAC CCT TT GGG G GCAGT GT CT T CC CATAAT C AC CAAGACAAGA 18 91 

I I I I I I I I I I I I I I I I I I I 

ACTTAAGT CACAAT C CTT T GT C AGGAGGAGG GGC AT TT C CACATT C C CT T GT T GCACT GA 191 

AGGGAGT GATT C GGGAAAGTT ACCT CAAAGGC CAC GAC CAGCT GGT T C C C GT CAC C CT CT 1951 

| | | | M I I I I I I I I I M I M I I I I I I M I M I I I I I I I I I I I I I I I I I I I M I 

AT G GAGT GATT C GGGAAAGTT ACC T CAAAGGC CAC GAC CAGCT GGTT C C CGT CAC C CT CT 251 

TGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCT 2011 

| | | M | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

TGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCT 311 

ACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGC 2071 

M I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I 

ACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGC 371 

TCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGG 2131 

I | || | | | | | | | | I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

TCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGG 431 

ACACT CAAT C CAAAGACC CAAAGC CGGAGG C CAT CCT CAC GC CACT CAT GC AC AACGG CA 2191 

I | | | | | | | | M I I I I I I I I I M M I I I I I I I I I I II I I I I II I I I I I I I I II I I I II I 

ACACT CAAT C CAAAGACC CAAAGC C GGAGG CAT T C CT CAC GCC ACTCAT G C ACAACGG CA 491 

AGCT CGCCACT — CCCGGCAACACGGC CAAGAT GCT CA-TTAAAGCAGACCAGCACCACC 224 8 
| M I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I M I I I I I I I I I I I I M I I I I 



Qy 


1832 


Db 


132 


Qy 


1892 


Db 


192 


Qy 


1952 


Db 


252 


Qy 


2012 


Db 


312 


Qy 


2072 


Db 


372 


Qy 


2132 


Db 


432 


Qy 


2192 



Db 492 AGCTCGCCACTTCCCGGGCAACACGGCCAAGATGCTCATTTAAAGCAGACCAGCANCACC 551 

Qy 224 9 TGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAAC 2288 

I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 552 T GGAC CT GAN GGCC CT C C C CAC C C CAGAGT CAAC C C CAAC 591 



RESULT 13 
US-09-976-594-632 

; Sequence 632, Application US/09976594 

; Patent No. 6673549 

; GENERAL INFORMATION: 

; APPLICANT: Furness, Michael 

; APPLICANT: Buchbinder, Jenny 

; TITLE OF INVENTION: GENES EXPRESSED IN C3A LIVER CELL CULTURES TREATED WITH 
STEROIDS 

FILE REFERENCE: PA-0041 US 
; CURRENT APPLICATION NUMBER: US/ 09/ 97 6, 594 
; CURRENT FILING DATE: 2001-10-12 

PRIOR APPLICATION NUMBER: 60/240,409 
; PRIOR FILING DATE: 2000-10-12 
; NUMBER OF SEQ ID NOS : 1143 

SOFTWARE: PERL Program 
; SEQ ID NO 632 
LENGTH: 42 8 6 
TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 
; NAME/ KEY: mis cofeature 

; OTHER INFORMATION: Incyte ID No. 6673549 238322.6 



US-09-976- 


-594- 


-632 




Query Match 8.2%; Score 252.6; DB 4; Length 4286; 
Best Local Similarity 58.9%; Pred. No. 2.6e-59; 

Matches 472; Conservative 0; Mismatches 324; Indels 5; Gaps 


2 


Qy 


164 


GGC T GGAC AT CCAGAT GAT TAT GAT CAT GAAC GGAAC CCT CT ACATT GC T GCT AGGGAC C 

I I I M | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGCTGGACTTTCAGAGATTCCTGACCTTGAACCGGACCTTGCTAGTGGCTGCCCGGGATC 


223 


Db 


431 


490 


Qy 


224 


AT AT T TAT AC T GT T GATAT AGAC ACAT C ACACAC GGAAGAAAT T TAT T GT AGCAAAAAAC 

1 1 1 1 1 1 1 1 1 1 1 1 II 1 M MIM 

ACGTTTTCTCCTTCGATCTTCAAGCCGAAGAAGAAGGGGAGGGGCTGGTGCCCAACAA — 


283 


Db 


491 


548 


Qy 


284 


T GACAT G GAAAT CT AG ACAGGC C GAT GT AGACACAT GCAGAAT GAAG GGAAAACAT AAGG 
I IN | M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 III 
- GT AT CT AACAT GGAGAAG C CAAGAT GT G GAGAACT GT G CT GT AC GG GGAAAG CT G AC G G 


343 


Db 


549 


607 


Qy 


344 


AT GAGT GC C ACAACT T TAT T AAAGTT CTT CT AAAGAAAAACGAT GAT GC AT T GTT T GT CT 

1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 

AT GAGT GCT ACAACT AT ATT CGT GTT CTT GTT CCCTGGGACTCCCAGACGCTCCTTGCCT 


403 


Db 


608 


667 


Qy 


404 


GT GGAACT AAT G CCT T CAACC CT T C CT G C AGAAAC T AT AAGAT GGAT AC ATT G GAAC CAT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 III II 1 1 1 1 

GTGGAACGAACTCATTCAGCCCTGTGTGCCGCAGCTATGGGATAACTTCGCTGCAGCAGG 


463 


Db 


668 


727 


Qy 


464 


T C GGGGAT GAAT T C AGC GGAAT GGC CAG AT GC C CAT AT GAT G C CAAAC AT GC CAAC GTT G 


523 



1 1 1 1 1 1 1 I 1 1 1 1 III I II 1 1 1 1 I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I 

Db 72 8 AG GGT GAG GAACT GAGT GGGCAG GC T CGAT GC C C CT T T GAT G C CAC C CAGT C CAAC GTG G 787 

Qy 52 4 CAC T GT TT GCAGAT G GAAAACTATACT CAG CCACAGT GACTGACT T C CT T GC CAT T GAC G 583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 78 8 CCATCTTTGCAGAGGGCAGCCTGTACTCAGCCACAGCTGCGGATTTCCAGGCCAGTGATG 847 

Qy 584 CAGTC ATT T AC C GGAGT CT T G GAGAAAGC C CT ACC CT GC G GAC CGT CAAGCAC GAT T CAA 643 

Ml MINIMUM! II I I I I I I I I I I I I I I I I I I 

Db 84 8 CTGTAGTTTACAGAAGCCTTGGGCCCCAGCCCCCACTCCGCTCCGCCAAGTATGACTCCA 907 

Qy 64 4 AAT GGT T GAAAGAAC CAT ACT T T GT T CAAG CC GT GGAT T ACGGAGAT TAT AT CT ACT T CT 7 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 908 AGTGGCTCCGAGAGCCACACTTTGTCCAGGCCTTGGAGCATGGAGACCATGTCTACTTCT 967 

Qy 704 T CT T C AGG GAAAT AGCAGT GGAGT AT AAC AC C AT GGGAAAGGT AGT T T T CCCAAGAGT G G 7 63 

I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 968 TCTTCCGCGAGGTCTCTGTGGAGGATGCTCGGCTGGGGAGGGTGCAGTTCTCCCGCGTAG 1027 

Qy 7 64 CT CAGGTT T GTAAGAAT GAT AT GG GAGGAT CT CAAAGAGT C CT — GGAGAAACAGTGGAC 821 

II I I I II I I I I I I I I I I I I II I I II II I I I I II I 

Db 1028 CCCGAGTATGTAAACGTGACATGGGCGGCTCGCCTTCGGGTCTTGGTACCGCCACTGGAC 1087 

Qy 822 GTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAA 881 

I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 108 8 ATCCTTCCTGAAGCTTCGGCTCAACTGCTCTGTCCCTGGGGACTCTACTTTCTATTTTGA 1147 

Qy 882 CATT C T C CAGG C AGTT AC AGAT GT GATT C GT AT CAAC GGGCGT GAT GT T GT C CT GGCAAC 941 

I I I I I I I I I II I , I I I I I I I I I I I I I I 

Db 114 8 TGTTTTACAGGCCTTGACTGGGCCTGTGAACCTGCATGGCCGCTCTGCTCTCTTTGGGGT 12 07 

Qy 942 GT T T T CT AC AC CT TAT AAC AG 962 

II I I I I I I I I 

Db 12 08 CT T C ACCAC CC AGACCAAT AG 122 8 



RESULT 14 
US-09-833-381-3 

; Sequence 3, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 

FILE REFERENCE: 58 00-119 
; CURRENT APPLICATION NUMBER: US/09/833, 381 
; CURRENT FILING DATE: 2001-04-11 
; PRIOR APPLICATION NUMBER: 09/516,448 
; PRIOR FILING DATE: 2000-02-29 
; NUMBER OF SEQ ID NOS : 2050 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 3 
; LENGTH: 775 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
FEATURE : 

NAME/ KEY : mis c_f eature 
; LOCATION: (1) . - . (775) 



; OTHER INFORMATION: n = A,T,C or G 

US-09-833-381-3 



Query Match 7.1%; Score 220; DB 4; Length 775; 

Best Local Similarity 100.0%; Pred. No. 9.8e-51; 

Matches 220; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 74 3 AGGT AGT T T T C C C AAGAGT GG CT CAGGT TTGT AAGAAT GAT AT GGGAGGAT CT CAAAGAG 8 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I ! I I I 
Db 131 AGGT AGT T T T C C CAAGAGT GG CT CAGGT T TGT AAGAAT GAT AT GGGAGGAT CT CAAAGAG 190 

Qy 8 03 TCCTGGAGAAACAGTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAG 8 62 

I M M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 191 TCCTGGAGAAACAGTGGACGTCGTTCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAG 250 

Qy 8 63 ACT CT CAT T T T TAT TT CAAC AT T CT C C AGGCAGT T AC AGAT GT GAT T C GT AT CAAC GGGC 922 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 251 ACT CT CAT T T T TAT T T CAAC AT T CT C C AGGCAGT T ACAGAT GT GAT T C GT AT CAACGGG C 310 

Qy 923 GT GAT GT T GT C CTG GCAAC GT T TT CTACAC CT TAT AAC AG 962 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 311 GTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAACAG 350 



RESULT 15 
US-08-121-713D-57 

Sequence 57, Application US/08121713D 
Patent No. 5639856 
GENERAL INFORMATION: 

APPLICANT: Goodman, Corey S. 
APPLICANT: Kolodkin, Alex L. 
APPLICANT: Matthes, David 
APPLICANT: Bentley, David R. 
APPLICANT: O'Connor, Timothy 

TITLE OF INVENTION: The Semaphorin Gene Family 
NUMBER OF SEQUENCES: 100 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 Bush Street, Suite 3200 
CITY: San Francisco 
STATE: CA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/121, 713D 
FILING DATE: 13-SEP-1993 
CLASSIFICATION: 514 
ATTORNEY/AGENT INFORMATION: 
NAME: Osman, Richard A. 
REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: B94-002-1 
TELECOMMUNICATION INFORMATION: 



TELEPHONE: ( 4 15 ) 343-4 34 1 
TELEFAX: (415) 343-4342 
TELEX: 

INFORMATION FOR SEQ ID NO: 57: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 2854 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 451. .2640 
US-08-121-713D-57 

Query Match 5.4%; Score 166; DB 1; Length 2854; 

Best Local Similarity 53.0%; Pred. No. 1.8e-35; 

Matches 532; Conservative 0; Mismatches 415; Indels 57; Gaps 6; 

Qy 2 89 T GGAAATCTAGACAGGCCGATGT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAG 34 8 

I I I I I I I I I I I I II III I II I I I I I I I I I I I 

Db 709 TGGCACTCGTCAGGTGCCCATCGCGAGCTCTGCTACCTCAAGGGGAAGTCAGAGGACGAC 768 

Qy 34 9 T GC CACAACT T TAT T AAAGTT CT T CTAAAGAAAAAC GAT GAT GC AT T GTT T GT CT GT GGA 4 08 

I I M I I II I II Mill Ml M I I I I I I I I I I I I I 

Db 7 69 T GCCAGAACT ACAT CCGAGT CCT GGC GAAAATTGAC GATGACCGCGTACT CAT CT GCGGT 828 

Qy 4 09 ACTAAT GCCT T CAACC CT T C CT G CAGAAACT AT AAGAT G GAT AC AT T G G AAC CAT T C 465 

I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 829 AC GAAC GCCT ATAAGC CACT AT GT CGGCACT AC GC C CT C AAGGAT G GAGAT TAT GTT GTA 88 8 

Qy 466 GGGGAT GAAT T CAGCGGAAT GGC CAGAT GC C CAT AT GAT GC CAAAC AT G C CAAC GTT G CA 525 

I I I I I I I I I I I I I I I I I I I I I I I III III I I I I 

Db 889 GAGAAAGAAT AT GAGGGAAGAGGATT GTGCCCATTT GACCCTGACCACAACAGCACT GCA 94 8 

Qy 52 6 CTGTTT GCAGAT GGAAAACTATACTCAGCCACAGTGACT GACTT CCTT GCCATT GACGCA 585 

II I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I 

Db 949 ATATACAGT GAGGGACAATT GT ACTCAGCAACAGTGGCAGACTT CT CT GGAACT GACCCT 1008 

Qy 58 6 GT CAT T TAC C GGAGT CT T GGAGAAAG C CCT AC C CT GC GGAC C GT CAAGC AC GAT T CAAAA 645 

I I I I I I I I I II I M I I I I I II 'IN 

Db 1009 CTCATATACCGCGGCC CT C T AAGAACAGAGAGAT CT GAC CT CAAA 1053 

Qy 646 TGGTT GAAAGAACCAT ACTTT GTT CAAGCCGT GGATTAC GGAGATT ATAT CTACTT CTTC 705 

I I I I I II I I I I II I I I I I M II I II II I I I I I M II I I 
Db 1054 CAATTAAAT GCT C CT AACT T T GT CAACACAAT GGAGT ACAAT GAT T T T AT ATT CTT CT T C 1113 

Qy 70 6 TT CAGGGAAATAGCAGT GGAGT AT AACAC CAT GGGAAAG GT AGT TT T CC CAAGAGT GGCT 765 

M I I I I I II I I I I II I I M I II I M I I II I I I I II I I I 
Db 1114 T T C CGAGAGACT GCT GT T GAGT ACAT CAACTG C GGAAAGGCT AT CT ATT CAAGAGT T G C C 1173 

Qy 766 CAGGTTTGTAAGAAT GAT ATGGGAGGATCT CAAAGAGTCCTGGAGAAACAGT GGACGT CG 825 

I I I I I II II I I I I I I I I MM I Mil I II I I I I 
Db 1174 AGAGT CT GT AAACAT GACAAGGG C GGC C CT CAT CAG GGT GGT GAC AGA TGGACTTCT 1230 



Qy 



82 6 T T C CT GAAGGC G C GCT T G7VACT GCT CAGT T CCT GGAGACT CT CAT T T TT ATT T CAACAT T 88 5 
II MM III II I I I I I II I I I II II I II I II I I I I I II II I 



Db 



1231 TTTTTGAAATCACGTCTGAACTGTTCCGTCCCTGGAGATTATCCATTTTACTTCAATGAA 1290 



Qy 886 C T C C AGGCAGT T ACAGAT GT GATT C GT AT CAACGG G C GT GAT GT T GTC CT GGCAAC 941 

I I I I I I I I I I I I I M I I I I M II 

Db 1291 AT T C AGT CAACAAGT GAC AT C ATT GAAG GAAAT TAT GGT GGT CAAGT GGAGAAACT CAT C 1350 

Qy 942 GT T T T CT ACAC CT T ATAAC AGCAT CC CT GG GT CT GCAGT CT GT GCC T AT GAC 993 

II I I I I I I III M II I M I I I I I I I I I I I I 

Db 1351 TACGGTGTCTTCACGACACCAGTGAACTCTATTGGTGGCTCTGCTGTTTGTGCCTTCAGT 1410 

Qy 994 AT GCT T GACAT T GC CAGT GTTT TT ACT G GGAGAT T CAAGGAACAGAAGT CT C CT GATT C C 1053 

Ml || I I I I I I II I I I I I I I I I I III 

Db 1411 AT GAAGT CAATACTT GAGT CATTTGAT GGTC CATTTAAAGAGCAGGAAACGATGAACT CA 1470 

Qy 1054 ACCTGGACACCAGTTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGC 1113 

| I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 14 71 AACT G GT T GGC AGT G CCAAG C CTTAAAGT G C CAGAAC CAAGGCCT GGACAAT GT GT 152 6 

Qy 1114 T CAT C CT CCT T AGAAAGAT AT GCAACCT C C AAT GAGTT C C CT GAT GAT AC C CT GAACT T C 1173 

I I I I I I I II I I I I I I I I I I I I I I 

Db 1527 GAAT GAC AGT C GT AC AC TTCCTGATGTGTCTGTCAATTTT 1566 

Qy 1174 AT CAAGAC GCACCC GCT CAT GGAT GAGGCAGT G C C CT C CAT CTT CAACAG G C CAT GGT T C 1233 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M 
Db 1567 GTAAAGT CACATACACT GAT GGAT GAGGCCGT GCCAGCATT TTTTACT CGGCCAATT CT C 162 6 

Qy 1234 C T G AGAAC AAT GGT C AGAT AC C G C C T T AC C AAAAT T G CAGT G G A 1277 

I II I I I I I I I I I I I I I I I I I I I I I 

Db 1627 AT T C GGAT C AGCT T AC AGT AC AGAT T T AC AAAAAT AGCT GT T GA 167 0 

Search completed: March 26, 2004, 03:46:03 
Job time : 229.203 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Cornpugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on : 



March 25, 2004, 23:27:11 ; Search time 1097.37 Seconds 

(without alignments) 
10493.560 Million cell updates/s 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



Searched: 



US-09-856-681A-1 
3093 

1 atgaggtcagaagccttgct . 

IDENTITY_NUC 

Gapop 10.0 , Gapext l.C 



2458946 seqs, 1861504846 residues 



, ccaatgatgcgtgtacataa 3093 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



4917892 



Database : 



Published_Applications_NA: * 

1 : /cgn2_6/ptodata/l/pubpna/US07_PUBCOMB. seq: * 

2 : /cgn2_6/ptodata/l/pubpna/PCT_NEW_PUB . seq:* 

3: /cgn2_6/ptodata/l/pubpna/US06_NEW_PUB. seq:* 

4 : /cgn2_6/ptodata/l/pubpna/US06_PUBCOMB. seq: * 

5: /cgn2_6/ptodata/l/pubpna/US07_NEW_PUB. seq:* 

6 : / cgn2_6/ptoda ta/ 1/pubpna/ PCTUS_PUBCOMB . seq : * 

7: /cgn2_6/ptodata/l/pubpna/US08_NEW_PUB.seq:* 

8: /cgn2_6/ptodata/l/pubpna/US08_PUBCOMB. seq:* 

9: /cgn2_6/ptodata/l/pubpna/US09A_PUBCOMB.seq: * 

10: /cgn2_6/ptodata/l/pubpna/US09B_PUBCOMB.seq:* 

11: /cgn2__6/ptodata/l/pubpna/US09C_PUBCOMB.seq: * 

12 : /cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq: * 

13: /cgn2_6/ptodata/l/pubpna/US10A_PUBCOMB.seq: * 

14: /cgn2_6/ptodata/l/pubpna/US10B_PUBCOMB.seq: * 

15: /cgn2_6/ptodata/l/pubpna/USl0C_PUBCOMB.seq:* 

16: /cgn2_6/ptodata/l/pubpna/US10_NEW_PUB. seq:* 

17: /cgn2_6/ptodata/l/pubpna/US60_NEW_PUB. seq:* 

18 : /cgn2_6/ptodata/l/pubpna/US60_PUBCOMB. seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



% 

Result Query 

No. Score Match Length DB 



ID 
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ALIGNMENTS 



RESULT 1 
US-09-991-053-3 

; Sequence 3, Application US/09991053 
; Publication No. US20030003532A1 
; GENERAL INFORMATION: 
; APPLICANT: Shimkets, Richard A. 



TITLE OF INVENTION: NOVEL NUCLEIC ACID SEQUENCES ENCODING HUMAN SLIT-, 
TITLE OF INVENTION: MEGF-, AND ROUNDABOUT -LIKE POLYPEPTIDES 
FILE REFERENCE: 15966-540 CON S-10 
CURRENT APPLICATION NUMBER: US/09/991, 053 
CURRENT FILING DATE: 2002-05-23 
PRIOR APPLICATION NUMBER: USSN 60/123,667 
PRIOR FILING DATE: 1999-03-09 
PRIOR APPLICATION NUMBER: 09/520,781 
PRIOR FILING DATE: 2000-03-08 
NUMBER OF SEQ ID NOS : 81 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 3 
LENGTH: 34 98 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (214 ).. (3030) 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (3047) 

OTHER INFORMATION: an n may be any one of a or t or g or c 
US-09-991-053-3 

Query Match 98.2%; Score 3038; DB 10; Length 3498; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 3072; Conservative 0; Mismatches 21; Indels 2; Gaps 2; 

ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

| | | | I I I I I I M I I I I I I I I I I I I I I > I I I I M I I I I I I I I I I I I I I I I I I I M M I M I 

ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

C CAGAAGAT T CT GAGC CAAT C AGT AT TT C GCAT G G CAACT AT ACAAAACAGT AT C C GGT G 12 0 

| | I I I I M I I I I I I I I I I I I I I I II I I I I I I I I M I II M I I I I I I I I I I I I II 

C CAGAAGAT T CT GAGC CAAT C AGT AT TT C GCAT G GCAACT AT ACAAAACAGT AT C C GGT G 333 
T T T GT GGGCCACAAGC CAGGACGGAAC AC CACAC AGAGGCACAG GCT GGACAT C C AGAT G 180 

M | I I I I I I I M M I I II I I II I I M I II I I I I I I M I I I I I I I I I I I I I I 

TTT GT GGGCCACAAGCCAGGAC GGAACAC CACAC AGAGGCACAGGCT GGACATC CAGAT G 



Qy 


1 


Db 


214 


Qy 


61 


Db 


274 


Qy 


121 


Db 


334 


Qy 


181 


Db 


394 


Qy 


241 


Db 


454 


Qy 


301 


Db 


514 


Qy 


361 


Db 


574 



393 



AT TAT GAT CAT GAAC GGAAC C CT CT AC AT T GCT G CT AG GGAC CAT AT T TAT ACT GT T GAT 240 

M | | I I M I II I I I I I I I I I M I I I I I II I I M I M I I I I I I I M I I I I I I I I I I 

ATT AT GAT CAT GAAC GGAAC C CT CTAC AT T GCT G C TAG GGAC CAT AT T TAT ACT GT T GAT 4 53 



|| || | | | M I I I I II I I II M I I M I I I I I I I I I I I I M I I I I I I I M M I I I I I I M I I 



300 



360 



CAGG CC GAT GT AGACACAT GCAGAAT GAAGGGAAAAC AT AAGGAT GAGT GC C ACAACTTT 

| | | | | | | | | | | I II I I I I I I I I I II I M I I I I I I I I I I I M I I I I I M M I I I I I I II I I 

CAGGC CGAT GT AGACACAT GCAGAAT GAAGGGAAAAC AT AAGGAT GAGT GC C ACAACTTT 573 
ATTA7\AGTTCTTCT7\AAGAAAAACGATGATGCATTGTTTGTCTGTGGAACT7\ATGCCTTC 420 

I I | | M II I I I I I I I I I I M I I I II I I I I I I I I I I I M I I I I I I I I I I M M I I M I I I I 

ATTAAAGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 633 



Qy 



421 AACCCTT CCT GCAGAAACTATAAGAT GGATACATTGGAACCATT CGGGGAT GAATT CAGC 48 0 



634 AACCCTT CCT GCAGAAACTATAAGAT GGAT ACATTGGAAC CATT CGGGGAT GAATT CAGC 693 

481 GGAAT GGCCAGAT GCC CATATGAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 54 0 

| M I I I I I I I M I I I I I I I I I I I I I I I I M M I I I I I I M I I I I I I I I I I I I I I I I I I I I 
694 GGAAT GG C CAGAT GCC CAT AT GAT G C CAAACAT GCCAAC GTT GC ACT GT T T GCAGAT GGA 753 

541 AAACT ATACT CAGCCACAGT GACT GACTT C CTT GCCATT GACGCAGT CATTTAC CGGAGT 600 

| M | | | | I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I M I I I I I M 
754 AAACTATACT CAGCCACAGT GACTGACTT CCTT GCCATT GACGCAGT CATTT ACCGGAGT 813 

601 CTT GGAGAAAG C C CT AC CCT GC G GAC C GT CAAGCAC GAT T CAAAAT G GT T GAAAGAACCA 660 

| | | | | | I I I I I M I I I I I I I l-l I I I I I I I I I I I I I I M I I I I I I I I I I M I II I I I I I I I 
814 CT T GGAGAAAG C CCT AC C CT GC GGAC C GT CAAG CAC GAT T CAAAAT GGT T GAAAGAACCA 873 

661 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 720 

| | | | || | M I I I I M I I M I M I I I I II I I I I I I I I I M I I M I I I II I I I I II I I I II I 
87 4 T ACT T T GT T CAAGC C GT GGATT ACG GAGAT TAT AT CT ACTT CT T CT T CAGGGAAAT AG CA 933 

721 GT GGAGT AT AACAC CAT GGGAAAGGTAGT T T T C CCAAGAGT GG CT CAGGT T T GT AAGAAT 780 

| | | | | | | | | | I I I I I M I I I I I I I II I I I II Mill MINI II 

934 GT GGAGT AT AACAC C AT GGGAAAGGT AGTT T T C CCAAGAGT GGCT CAGGT T T GTAAGAAT 993 

781 GAT AT GGGAG GAT CT CAAAGAGT CCT GGAGAAAC AGT G GAC GT C GT T C CT GAAGGC GC GC 84 0 

| | | M | | | | | | | | | | I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I N I II 
994 GAT AT GGGAG GATCT CAAAGAGT CCT GGAGAAAC AGT G GAC GT C GT T C CT GAAGGC GC GC 1053 

841 T T GAACT GCT CAGT T CCT GGAGAC T CT CATT T TT AT T T CAACAT T CT C CAGGCAGT T ACA 900 

| | | | | | | I I I I M M I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I 

1054 T T GAACT GCT CAGT T CCT GGAGACT CT C ATT T TT AT TT CAACAT T CT C CAGGCAGT T ACA 1113 

901 GAT GT GATT C GT AT CAAC GGGC GT GAT GT T GT CCT GGCAAC GTT T T CT ACAC CT T AT AAC 960 

| || M I I I I I I I I I M I I I I I I I I I M I II I I II M I II I I I I I II II I M I M 

1114 GAT GT GAT T C GT AT CAAC GGGC GT GAT GT T GT CCT GGCAAC GTT T T CT AC AC CT TAT AAC 1173 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 
| | | | I II I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I 
1174 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1233 

1021 GG GAGAT T CAAGGAACAGAAGT CT C CT GAT T CCAC CT GGACAC C AGTT CCT GAT GAAC GA 1080 

| | | | | | I M M I I M I I I II I I I I I I II I II I I I I I I I I I M I I I I I I I I I I I I M II I I 
1234 GGGAGATTCAAGGAACAGAAGTCT CCTGATT CCACCT GGACAC CAGTT CCT GAT GAAC GA 1293 

1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

| | | | | || | | | | | | | | | | I I I I I II I I I I I I I I I I M II I I M I I I I I I I I I I I I I I I I M 

1294 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1353 

1141 T C CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CATCAAGAC GC ACCC G CT CAT GGAT GAG 1200 

| M I II I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I M I I I 
1354 T CCAAT GAGTTCCCT GATGATAC CCT GAACTT CATCAAGACGCACCCGCT CAT GGAT GAG 1413 

1201 G CAGT GCC CT C CAT CT T CAACAG GC C AT GGTT C CT GAGAACAAT GGT CAGAT AC CG C CT T 1260 

| | | | | | M | | | I II I I I I I I I I I I I I II I I I I I I M I I I I II I I I I I I I I I I I I I I M I I 
1414 G CAGT GCC CT C C AT CT T CAACAGGC CAT GGTT CCT GAGAACAAT GGT CAGAT ACCG C CT T 1473 

1261 ACCAAAATT GCAGTGGACACAGCTGCT GGGCCATAT CAGAAT CACACTGT GGTTTTT CT G 132 0 
| | | | | | || | | | | | | I I I I I I I I I I I I I I I I I M I I I I I II I M I I I I I I M I I I I I I I M 



Db 1474 AC CAAAATT GCAGT GGACACAGCTGCT GGGCCATAT CAGAAT CACACTGT GGTTTTT CTG 1533 

Qy 1321 GGAT CAGAGAAGGGAATCAT CTTGAAGTTTTT GGCCAGAATAGGAAATAGT GGTTTT CTA 1380 

I II I I I I M I I I I I I I I I I I I II I I I I II I I I I I I I II I I I I I I I M I 

Db 1534 GGAT CAGAGAAGGGAATCAT CTTGAAGTTTTT GGCCAGAATAGGAAATAGT GGTTTT CTA 1593 

Qy 1381 AAT GAC AGC CTT T T C CT GGAG GAGAT GAGT GT T T ACAAC T CT GAAAAAT G C AGCT AT GAT 1440 

I I I I I I I I I I I I I I I II I I I I I I M I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1594 AAT GAC AG CCTT T T C CT GGAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GC AGCT AT GAT 1653 

Qy 1441 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CT CT GT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1654 G GAGT C GAAGACAAAAGGAT CAT GGGCAT GC AG CT G GAC AGAGCAAGCAGCT CT CT GT AT 1713 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I II 

Db 1714 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1773 

Qy 1561 T GTAAAAAAAC CT GTAT T GCCT C C AGAGACC C AT AT T GTGGAT GGAT AAAG GAAGGT GGT 1620 

I I I I I I I I M I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I 

Db 1774 T GTAAAAAAAC CT GTAT T GC CT C CAGAGAC C CAT AT T GT GGAT GGATAAAGGAAGGT GGT 1833 

Qy 1621 GCCT GC AGCC AT T TAT CAC C CAACAGCAGACT GACT T T T GAGCAGGACAT AGAGC GT GGC 168 0 

| M II I I I I I I I I I I I I I I M I I I I I I I M I I I II I M I I I I I I I I I M I I I I I I I I I I I 
Db 1834 GCCT GC AGCC AT TTAT CAC C CAACAGCAGACT GAC T T T T GAGCAGGACAT AGAGCGT GGC 1893 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 1740 

M | | | | | | | | | I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I M I I I M I I I I I I I I I 
Db 1894 AAT AC AGAT GGT CT GG GGGACT GT CACAAT T C CT T T GT GG CACT GAAT GGGCAT T C CAGT 1953 

Qy 1741 T CCCTCTT GCC CAGCACAACCACAT CAGATT CGACGGCT CAAGAGGGGTATGAGT CTAGG 1800 

| | | I I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I M II I I I I 
Db 1954 TCCCTCTTGCC CAGCACAACCACAT CAGAT T CGAC G GCT CAAGAGGGGT AT GAGT CTAGG 2013 

Qy 1801 GGAGGAATGCT GGACT GGAAGCAT CT GCT T GACT CACCT GACAGCACAGACC CTTTGGGG 1860 

| I M M I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I 
D b 2014 GGAGGAAT GCT G GACT GGAAGCAT CT GCTT GACT C AC CT GACAGC AC AGAC CCTTTGGGG 2073 

Qy 1861 GCAGT GT CT T C C CAT AAT CACCAAGACAAGAAGGGAGT GAT T CGGGAAAGT T AC CT CAAA 1920 

| I I I I I I I II I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I M I I I 
Db 2074 GCAGT GTCT T C C CAT AAT CAC CAAGACAAGAAGGGAGT GAT T CG G GAAAGT T AC CT CAAA 2133 

Qy 1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 198 0 

I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I M I II I I I I I I M I I I I I I I I I I I I 

Db 2134 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2193 

Qy 1981 AT GGGGGC CGT CTT CT C GGGCAT CACC GT CTACT GC GT CT GTGAT CATCGGCGCAAAGAC 204 0 

| | | | I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I 
Db 2194 AT GGGGGCCGT CTT CTCGGGCATCACCGTCTACTGCGTCT GTGAT CATCGGCGCAAAGAC 2253 

Qy 2041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

| M I I I I I I II I I I M I I I II I I I I I I I I I I I II I I I I I I I I II I I I I I I I M I I II I II 

Db 2254 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2313 

Qy 2101 AG C GT CAC CAAG CT C AGC GGC CT CT T T G GGGAC ACT CAAT CCAAAGACC CAAAGC C G GAG 2160 

| M M I II I I I I I I I I I I I N N I I I I I I I II I I I I I I I I I I I M M I I I I I I I I I I I I I 

Db 2 314 AGC GT CAC C AAG CT C AGC GGCCTCTTT GGGGAC ACT CAAT CCAAAGACC CAAAGC CG GAG 2373 



2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 222 0 

| | | I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I II II I I I I I I I I I I I I M I 

2374 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2433 

2221 ATGCTCATTAAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCA 22 8 0 

| | I I I I I M I I I I I I I II II I I I I I I II I I I I I I I I I I I I M I M I I II I I I I I I I I I I I 
2434 AT GCT CAT TAAAG CAGAC C AGC ACCAC CT GGAC CT GACGGCC CT C C C CAC CC CAGAGT CA 2493 

2281 AC C CCAAC GCT GC AGC AGAAGC GGAAGC C CAGCC G C GG CAGC C GC GAGT GGGAGAGGAAC 234 0 

| | | | I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M 
24 94 AC C CCAAC GCT G CAGCAGAAGC GGGAAC C CAG C C GC G GC ACC C GC GAGT GGGAGAGGAAC 2553 

2341 CAGAAC CT CAT CAAT GCCT G C ACAAAGGACAT GC C C C C C AT GGGCT C C C CT GT GAT T CC C 24 00 

| | | | | | | | I I I I I I I I I II II I I I I I I I I I I I I II I I I I I ! I I I I I I I M I I I M I I I I I 

2554 CAGAACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 2 613 

2401 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2 4 60 

| | | M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2614 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2 673 

2461 ACGCAGCAGGGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAG 2520 

I I I I I I I I I I I I I M I II M I II I I II I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I 
2674 AC GC AGC AGGG CT AC CAGCAT GAGTACGT GGAC CAG CC CAAAAT GAGC GAGGT GG C CCAG 27 33 

2521 ATGGCGCT GGAGGACCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACATCT CAGC 2 58 0 

M I I II I M II I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I M I II II I I 
27 34 AT GGC GCT GGAGGAC CAGG C C GCCACACT GGAGT AT AAGAC CAT CAAG GAAC AT CT CAGC 2793 

2581 AGCAAGAGT C C CAAC CAT GG GGT GAAC CT T GT GGAGAAC CT GGAC AGC CT GC CCC C CAAA 2 640 

| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M II I I I I I II I I I I I I I I 
2794 AGCAAGAGT C C CAAC CAT GG GGT GAAC CTT GT GGAGAAC CT GGAC AGC CT G C CC C C CAAA 2 853 

2641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

| I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 854 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2913 

27 01 AGCAAGCGGCT GGAAAT GCAC CACT CCT CTT CCT ACGGGGTT GACTATAAGAGGAGCTAC 27 60 

| | | | | I M I I M I II I I I I I I I I I I I I I I I I I I II I I II I II I I I I I II II I I I I I I I I I 
2 914 AGCAAGCGGCT GGAAAT GCAC CACT CCT CTT CCT ACGGGGTT GACTATAAGAGGAGCTAC 2973 

2761 C C CACGAACT C GCT CAC GAGAAGC CAC CAGGCC AC C - ACT CT CAAAAGAAAC AAC ACTAA 2819 

|| | | | | | | | | | | I I I I I I I II I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I 
2974 CCCACGAACT CGCT CAC GAGAAGC CAC CT GACCACCT ACT CTCATC AGAAGCAACACTAA 3033 

2 820 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 287 8 

Ml | | | | | | Ml II II I I I I I I I I I II II II I I I I I M I I M I I I I 

3034 CCCCGACAATTCANCTCTGACTTCAAAGGGACCAGAGCTTTGGCAGGGGAGACAACCCGC 3093 

2879 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2938 

| | M I I I I I M I I I I I M M I I I M I M I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 

3 094 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 3153 

2 939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 

M II I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
3154 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3213 



Qy 



2999 



TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 



Db 



3214 




Qy 



3059 



C CAC AT C CAT GAAGC C CAATGAT GC GT GT AC ATAA 3093 




Db 



3274 



C CAC AT C CAT GAAG C C C AAT GAT G C GT GT AC AT AA 3308 



RESULT 2 
US-09-957-187-3 

; Sequence 3, Application US/09957187 
; Publication No. US20030054514A1 
; GENERAL INFORMATION: 
; APPLICANT: Shimkets, Richard A. 
; APPLICANT: LaRochelle, William 

; TITLE OF INVENTION: NOVEL POLYNUCLEOTIDES AND PROTEINS ENCODED THEREBY 

; FILE REFERENCE: 15966-540 CIP 

; CURRENT APPLICATION NUMBER: US/09/957 , 187 

; CURRENT FILING DATE: 2000-09-19 

PRIOR APPLICATION NUMBER: 60/123,667 
; PRIOR FILING DATE: 1999-03-09 
; PRIOR APPLICATION NUMBER: 09/520,781 
; PRIOR FILING DATE: 2000-03-03 
; PRIOR APPLICATION NUMBER: 60/234,082 
; PRIOR FILING DATE: 2000-09-20 
; PRIOR APPLICATION NUMBER: 60/233,798 
; PRIOR FILING DATE: 2000-09-19 
; PRIOR APPLICATION NUMBER: 60/174,485 
; PRIOR FILING DATE: 2000-01-04 
; NUMBER OF SEQ ID NOS : 85 

SOFTWARE: PatentlnVer. 2.1 
; SEQ ID NO 3 
; LENGTH: 34 98 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 
; NAME/ KEY: CDS 

LOCATION: (214 ).. (3030) 

NAME/KEY: misc_feature 
; LOCATION: (3047) 

; OTHER INFORMATION: an n may be any one of a or t or g or c 
US-09-957-187-3 

Query Match 98.2%; Score 3038; DB 10; Length 3498; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 3072; Conservative 0; Mismatches 21; Indels 2; Gaps 2; 



Qy 



1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 




Db 



214 AT GAGGT C AGAAGC CT T GCT GCT AT ATTT CACACT GCT ACACT TT GCT GGGGCT GGTTT C 27 3 



Qy 



61 C C AGAAGAT T CT GAGC CAAT C AGT AT T T C GCAT GGCAACT AT ACAAAACAGT AT C C GGT G 120 




Db 



274 C CAGAAGATT CT GAGC CAAT C AGT ATTT CGCAT GG CAACTAT ACAAAACAGT AT C C GGT G 333 



Qy 



121 TTTGTGGGC CAC AAGC CAG GAC GGAACAC CAC AC AGAGGCACAGG CT GGACAT CCAGAT G 180 



334 T T T GT GGGC CACAAG C C AGGAC GGAACAC CACACAGAGGCAC AGGCT GGACAT C C AGAT G 393 

181 AT TAT GAT CAT GAAC GGAACC CT CT AC AT T GCT G CT AG GGAC CAT ATT TAT ACT GT T GAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II M I M I I I I II I I I I M II 
394 AT TAT GAT CAT GAAC GGAAC C C T CT ACAT T GCT GCTAGGGAC CAT ATT TAT ACT GT T GAT 453 

241 ATAGACACATCACACACGGAAGAAATTTATT GTAGCAAAAAACTGACAT GGAAAT CTAGA 300 

I I I I I M M I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I 
454 ATAGACACAT CACACACGGAAGAAATTT ATT GTAGCAAAAAACT GACAT GGAAAT CTAGA 513 

301 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGT GCCACAACTTT 360 

| I I I M I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
514 CAGG CC GAT GTAGACACAT GCAGAAT GAAGGGAAAACAT AAG GAT GAGT GC CACAACTT T 573 

361 AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACT AAT GC CT T C 420 

| | | | I I I I I M I I I M I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
57 4 ATT AAAGT T CT T CT AAAGAAAAAC GAT GAT G CATT GT T T GT CT GT GGAACT AAT G CCTT C 633 

421 AAC C CT T C CT GCAGAAAC TAT AAGAT GGAT ACAT T GGAAC C ATT C GGGGAT GAATT C AGC 4 80 

| M I I I I I I I I I I I I M II I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I II I II I I I I 
634 AAC CCTT CCT GCAGAAACTATAAGATGGATACATT GGAAC CATT CGGGGAT GAATTCAGC 693 

481 GGAATG GC C AGAT GC C CAT AT GAT GCCAAACAT G C CAACGT T GCACT GTT T GC AGAT GGA 540 

I | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I 
694 GGAATGGCCAGAT GCCCATATGAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGATGGA 753 

541 AAAC TAT ACT CAGC CAC AGT GACT GACT T C CTT GC C AT T GACGC AGT CAT T T AC C G GAGT 600 

| | M | | || | I I || I I I I M I I I I I I I I I II I II I I I I I I I M I I I I I I I I I I II I I I I I I 
754 AAAC TAT ACT CAGC CAC AGT GAC T GACTT C CTT GCC AT TGACG CAGT CAT T TAC C GGAGT 813 

601 CT T GGAGAAAGC C CT AC CCT GCGGAC C GT C AAGCAC GATT CAAAAT GGT T GAAAGAAC CA 660 

| M | | | | | || I | I I M II I II II I I I I I I M I I I I I I I I I II I I I I I M I I I I I I I I I I I 
814 CTT GGAGAAAGCCCTACCCT GCGGACC GT CAAGCAC GATT CAAAAT GGT T GAAAGAAC CA 873 

661 TACTT T GTT CAAGC CGT GGAT TAC GGAGAT TAT ATCTACT T CT T CTT CAGGGAAAT AGCA 720 

M | I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I II I I I I I II I I I 
874 T ACTT T GT T CAAGCC GT GGAT TAC GGAGAT T AT AT CT ACT T CT T CT T CAGGGAAAT AGC A 933 

721 GT GGAGT AT AACAC CAT GGGAAAGGT AGT T T T C C CAAGAGT G GCT C AGGTT T GT AAGAAT 78 0 

M | | | | || | | | | | | | II I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I M I I 
934 GT GGAGT AT AACACCAT GGGAAAGGT AGT T TT C C CAAGAGT G GCTC AGGT TT GTAAGAAT 993 

781 GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGACGT CGTT CCT GAAGGC GCGC 84 0 

|| | | M | || | | || | | I II I I I I I I I I I I I I I I I I I I I I M I I II I I II I I I I i I I I I I I I 
994 GATATGGGAGGATCT CAAAGAGT CCT GGAGAAACAGTGGACGT CGTT CCT GAAGGCGCGC 1053 

841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 
| | M | I I II I I I I I I I I I I I I I M II I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I 
1054 T T GAACT GCT CAGT T C CT G GAGACT CT C ATTT T TAT T T CAAC ATT CT C CAGG CAGT TAC A 1113 

901 GAT GT GAT T C GT AT CAAC G GG C GT G AT GT T GT C C T G GC AAC GT T T T CT AC AC CT T AT AAC 960 
| | | || | | | | | | | | | I I I I M I I I I II I I II I I I I I I I I M I I I I II I I I I I I I I I I M I I 
1114 GATGT GAT T C GTAT CAAC GGGC GT GAT GT T GT C CT G GCAAC GTTT T CT ACAC CTT AT AAC 1173 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 
|| | | | | | | | | | | | | | || | I I II I I I I I I II II I I I I I I I I I I I I I I I I M I I I I I I I I I I 



nK 

UD 


1174 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1233 


Qy 


1021 


GGGAGATTCAAGGAACAGAAGTCT CCT GATTCCACCT GGACACCAGTT CCT GAT GAACGA 


1080 




I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




nK 

UD 


19^4 

J. Z. O *i 


GGGAGATTCAAGGAACAGAAGTCT CCT GATT CCACCT GGACACCAGTT CCT GAT GAAC GA 


1293 


Qy 


1081 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1140 




I I I M | 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 




UD 


1 9Q4 


GT T P PT A A G P P P A GGP C AGGT T GP T GT GCT GGCT CAT CCT C CT T AGAAAGAT AT GCAAC C 


1353 


Qy 


1141 


TCCAATGAGTTCCCTGATGATACCCTGAACTTCATCAAGACGCACCCGCTCATGGATGAG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


1 "3S4 


t r r a at g a gt t r r r T g at g at a P P CT GAACT T C AT C AAGAC GCACC C GCT C AT GGAT GAG 


1413 


Qy 


1201 


GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 


1260 




I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 




UD 


1 A 1 .4 
_L 41 X fl 


ppaptpppptppatpttpAAPAGGPPATGGTTPCTGAGAACAATGGTCAGATACCGCCTT 


1473 


Qy 


1261 


ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 






X fl / *i 


&PPA AAATTPPAGTGGAPAPAGPTGPTGGGCCATATCAG7VATCACACTGTGGTTTTTCTG 


1533 


Qy 


1321 


GGATCAGAGAAGGGAATCATCTTGAAGTTTTTGGCCAGAATAGGAAATAGTGGTTTTCTA 


1380 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


1 JJ *i 


ppatpap AP A APPGAATPATPTTGAAGTTTTTGGPPAGAATAGGAAATAGTGGTTTTCTA 


1593 


Qy 


1381 


AATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTACAACTCTGAAAAATGCAGCTATGAT 


1440 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 




zi n^ri-ip z\PPPTTTTPPTGG AGG AG ATGAGTGTTTAPAAPTCTGAAAAATGCAGCTATGAT 


.1653 


Qy 


1441 


GGAGTCGAAGACAAAAGGATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTAT 


1500 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




UD 


X DO *i 


PP AGTPGAAGAP AAA AGGATPATGGGPATGPAGPTGGACAGAGCAAGCAGCTCTCTGTAT 


1713 


Qy 


1501 


GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


1714 
X f X *i 


GTTGPGTTPTPTAPPTGTGTGATAAAGGTTPPCCTTGGCCGGTGTGAACGACATGGGAAG 


1773 


Qy 


1561 


TGTAAAAAAACCTGTATTGCCTCCAGAGACCCATATTGTGGATGGATAAAGGAAGGTGGT 


1620 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


1 774 

X / / H. 


T PT A A A A A A AP PT P,T ATT GPPT P P AG AG AP PP AT AT TGT GGAT GGAT AAAGGAAGGT GGT 


1833 


Qy 


1621 


GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 


1680 






1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




nK 

1JD 


1 P^4 
X O O^l 


PPPTGPAGPPATTTATPAPPPAAPAGPAGAPTGACTTTTGAGCAGGACATAGAGCGTGGC 


1893 


Qy 


1681 


AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 


1740 




1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 




AATAPAGATGGTPTGGGGGAPTGTPAPAATTPCTTTGTGGCACTGAATGGGCATTCCAGT 


1953 


Qy 


1741 


TCCCTCTTGCC CAGCACAAC CACAT CAGATT C GAC GGCT CAAGAG G GGT AT GAGT CT AGG 


1800 




I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 I 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1954 


TCCCTCTTGCC CAGCACAAC CACAT CAGATT C GAC GG CT CAAGAGGGGT AT GAGT CTAGG 


2013 


Qy 


1801 


GGAGGAAT GCT GGACT GGAAGCAT CT GC T T GACT C AC CT GACAG CACAGAC C CTT T GG GG 


1860 




I | I | I I I M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


2014 


GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 


2073 



1861 G C AGT GT CTT C CCATAAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGTT AC CT CAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 074 GCAGT GT C TT C CCATAAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGT TAC CT CAAA 2133 

1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

2134 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2193 

1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2194 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2253 

2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

I I I I I I I I I I I I I I M I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2254 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2313 

2101 AG C GT CACCAAGCT CAGC GGC CT CTT T GG G GAC ACT CAAT C CAAAGAC CCAAAG C CGGAG 2160 

I I I I I I II I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I 

2 314 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2373 

2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2220 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
2374 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 2433 

2221 AT G C T CATT AAAGCAGACCAGCAC CAC CT GGAC CT GAC GGCCCTCCC CAC C CC AGAGT CA 228 0 

I I I I I I I I I I I I I I I II I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2434 ATGCTCATTAAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCA 2493 

2281 AC C C CAACGCTGCAGC AGAAG CGGAAGC C C AGC C GC GGC AGCC GCGAGT G GGAGAGGAAC 234 0 

I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I II I 
2494 ACCCCAACGCTGCAGCAGAAGCGGGAACCCAGCCGCGGCACCCGCGAGTGGGAGAGGAAC 2553 

2 341 CAGAACCT C AT CAAT GC CT GCACAAAGGAC AT GC CC C CC AT GGGCTCCCCTGT GAT T C CC 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I M I I I I I 
2554 CAGAAC CT C AT CAAT G C CT G CACAAAGGACAT GC CC C CCAT GGGCTCCCCTGT GATT C C C 2613 

2 4 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
2 614 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2673 

24 61 AC GCAGCAGGGCT ACC AG CAT GAGT AC GT GGAC C AG C CCAAAAT GAGCGAGGT G GC C CAG 252 0 

I M I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

2 674 AC G CAG CAGG GCT AC C AGCATGAGT AC GT G GAC CAGC CCAAAAT GAG CGAGGT GGC C CAG 2733 

2521 AT GGCGCT GGAGGACCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACAT CT CAGC 2580 

I I II I I I I I I I I I I I I I I I II I I I M I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2734 AT GGC GCT GGAGGACCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACAT CTCAGC 27 93 

2581 AG CAAGAGT C C CAAC CAT GG GGT GAACCT T GT GGAGAAC CT GGAC AGCCT GC C C CC CAAA 2640 

I II I I I I I I I I I I I I I I I M I II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2794 AGCAAGAGTCCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 28 53 

2 641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 27 00 

I M I I I I I I I I I I I I I I I II I I I I M M I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I 

2854 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2913 



Qy 2701 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2760 

I I I I I I I II I I I I II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 2914 AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2973 

Qy 2761 C C CAC GAACTC GCT C AC GAGAAGC CACCAGGC CAC C - ACT CT CAAAAGAAACAACACT AA 2819 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2974 C C CAC GAACTC GCT CAC GAGAAGC CACCT GACCAC C T AC T CT CAT CAGAAGCAACACT AA 3033 

Qy 282 0 CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 2878 

I I I I I I I I I III II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 3034 CCCCGACAATTCANCTCTGACTTCAAAGGGACCAGAGCTTTGGCAGGGGAGACAACCCGC 3093 

Qy 2879 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2938 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3094 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 3153 

Qy 2939 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I II I I I I I I I 
Db 3154 CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3213 

Qy 2999 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I I I I I I I I M I I I I I I I I I I M I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 3214 TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3273 

Qy 3059 C CAC AT C CAT GAAG C C CAAT GAT G C GT GT AC AT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3274 C CAC AT C CAT GAAGC CCAAT GAT GC GT GT ACAT AA 3308 
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US-10-403-676-31 

Query Match 98.2%; Score 3038; DB 12; Length 3498; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 3072; Conservative 0; Mismatches 21; Indels 2; Gaps 2; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I i I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 



QY 



61 CCAGAAGATT CTGAGC CAAT CAGTATTT CGCAT GGCAACT ATACAAAACAGTATCCGGTG 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 



Db 274 CCAGAAGATT CTGAGCCAATCAGTATTTCGCAT GGCAACTATACAAAACAGTAT CC GGT G 333 

Qy 121 TTT GTGGGCCACAAGC CAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGATG 18 0 

M I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 TTTGTGGGCCACAAGC CAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGATG 393 

Qy 181 ATTATGATCATGAACGGAACC CTCTACATT GCT GCT AGGGACCATATTTATACT GTT GAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ATT AT GAT CAT GAAC GGAAC C CT CT AC ATT GCT GCT AGGGACCAT AT T TAT ACT GT T GAT 453 

Qy 241 AT AGAC ACAT CAC ACAC GGAAGAAAT T T ATT GT AGCAAAAAACT GAC AT GGAAAT CT AGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 4 54 AT AGAC ACAT CAC ACAC GGAAGAAAT T TAT T GT AGCAAAAAAC T GAC AT GGAAAT CT AGA 513 

Qy 301 CAGGCC GAT GTAGACACATGCAGAATGAAGGGAAAACATAAGGAT GAGTGC CACAACTTT 360 

I I I I I I I I I I I I I I I I I I I I I I I I 1.1 M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 514 CAGGCCGAT GTAGACACATGCAGAAT GAAGGGAAAACATAAGGAT GAGTGC CACAACTTT 573 

Qy 361 ATT AAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACT AAT G C C T TC 420 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 ATT AAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT TGTTTGTCTGT GGAACT AAT G C CT T C 633 

Qy 421 AACCCTT CCT GCAGAAACTATAAGATGGAT ACAT T GGAAC CAT T C GGGGAT GAATTCAGC 480 

I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 634 AAC C CT T CCT GCAGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T C GGGGAT GAAT T C AGC 693 

Qy 4 81 GGAATGGCCAGAT GCCCATAT GAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 54 0 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GGAATGGCCAGAT GCCCATAT GAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 753 

Qy 541 AAACT AT ACT CAG C CACAGT GACT GACTT C CT T GC C ATT GACGC AGT CAT T TAC C GGAGT 600 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 AAACTAT ACT CAG C CACAGT GACT GACTT C CT T GC C AT T GACGC AGT CAT T TAC C GGAGT 813 

Qy 601 CTT GGAGAAAGCC CTACC CT GCGGACC GTCAAGCACGATT CAAAATGGTTGAAAGAACCA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I M I I I I I I I I I I I I I I 
Db 814 CTT G GAGAAAGCC CTAC C CT GC GGAC C GT CAAG CAC GATT CAAAAT G GTT GAAAGAAC CA 873 

Qy 661 TACTTT GTT CAAGCCGT GGATTAC GGAGATTATAT CTACTT CTT CTT CAGGGAAATAGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 TACT TT GTT CAAGC CGT GGAT TAC GGAGAT TAT AT CT ACT T CTT CTT CAGGGAAATAGCA 933 

Qy 721 GTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAAT 780 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 934 GT G GAGT AT AACAC CAT GGGAAAG GTAGTT TT C C CAAGAGT GGCT CAGGT T T GTAAGAAT 993 

Qy 7 81 GAT AT G GGAGGAT CT CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GTT C CT GAAGGCGC GC 840 

I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 994 GAT AT G G GAGGAT CT CAAAGAGT CCT GGAGAAAC AGT G GAC GT CGTT C CT GAAGG C GC GC 1053 

Qy 841 TTGT^ACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 T T GAACT GCT CAGT T C CT G GAGACT CT CAT T TT T ATT T CAACAT T CT C CAG GC AGTT ACA 1113 

Qy 901 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I 
Db 1114 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 1173 



Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1174 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1233 

Qy 1021 GGGAGAT T CAAGGAAC AGAAGT CT CCT GAT T C CAC CT GGAC AC CAGT T C CT GAT GAAC GA 108 0 

M I I M I I I I I I I I I I I I I I I I I I I I I M M I II I I I I I I I I I II I I I I I I I I I I 11 I I I 
Db 12 34 GGGAGATT CAAGGAAC AGAAGT CT CCT GATTCCACCT GGACACCAGTTC CT GAT GAACGA 12 93 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1294 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1353 

Qy 1141 T C CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAAGACGC AC C C GCT CAT GGAT GAG 1200 

I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1354 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGACGC AC CC GCT CAT GGAT GAG 1413 

Qy 1201 GC AGT GC C CT CCAT CT T CAACAGGC CAT GGT T C CT GAGAACAAT GGT CAGAT AC C GC CT T 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1414 GC AGT GCC CT C C AT CT T CAACAGGC CAT GGTT C CT GAGAACAAT G GT CAGAT AC C GC CTT 1473 

Qy 1261 AC CAAAAT T GC AGTGGACACAG CT GCT GGG CC AT AT CAGAAT CACACT GT GGT T TT T CT G 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I I I I I I 
Db 1474 AC CAAAAT T G CAGT G GAC ACAGCT GCT GGGCC AT AT CAGAAT CACACT GT GGT T T T T CT G 1533 

Qy 1321 GGAT CAGAGAAGG GAAT CAT CT T GAAGTT T TT GG C CAGAAT AGGAAAT AGT GGTT TT CT A 1380 

I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 1534 GGAT C AGAGAAGGGAAT CAT CT T GAAGTTT TT GGC CAGAAT AGGAAAT AGT GGT TT T CT A 1593 

Qy 1381 AAT GAC AG CCTTTTCCTG GAGGAGAT GAGT GT T T AC AACT CT GAAAAAT GCAGCT AT GAT 14 40 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 1594 AAT GACAGC CT TT T C CT GGAG GAGAT GAGT GTT T AC AACT CT GAAAAAT GCAGCT AT GAT 1653 

Qy 14 41 GGAGT CGAAGACAAAAGGAT CATGGGCAT GCAGCT GGACAGAGCAAGCAGCT CTCT GTAT 1500 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1654 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CTCT GTAT 1713 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I 
Db 1714 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1773 

Qy 1561 T GT AAAAAAAC CT GT ATT G CCT C C AGAGAC C CAT AT T GT GGAT GGAT AAAGGAAGGT GGT 1620 

I | I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I M 
Db 177 4 T GTAAAAAAAC CT GT ATT GCCT C CAGAG ACC C AT AT T GT GGAT GGAT AAAGGAAGGT GGT 1833 

Qy 1621 GCCT GCAGCCATTTAT CAC CCAACAGCAGACT GACTTTT GAGCAGGACATAGAGCGTGGC 1680 

I II I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 18 34 GC CT G CAG C C ATTT AT CAC CCAACAGCAGACT GACT TT T GAGCAGGACAT AGAG C GT GGC 18 93 

Qy 1681 AAT ACAGAT GGT CT GGGG GACT GT CAC AAT TCCTTTGTG GC ACT GAAT GGGCATT C CAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II II I I I I I I I II I I 

Db 18 94 AAT ACAGAT G GT CT G GG GGACT GT CACAATT C CT T T GT GGC ACT GAAT G GG CAT T C CAGT 1953 

Qy 17 41 T C C CT CT T GC C CAG C ACAAC C ACAT CAGATT C GAC GGCT CAAGAGG GGT AT GAGT CT AGG 1800 

II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1954 TCCCTCTTGCC CAGCACAAC C ACAT CAGATT C GAC QGCT CAAGAGGGGT AT GAGT CT AG G 2 013 



18 01 GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 1860 

M I I I I I I 11 I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I > M 
2014 GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 2073 

1861 GCAGT GT CT T C CC AT AAT C AC CAAGACAAGAAGGGAGT GAT T C GGGAAAGT TAC CT CAAA 1920 

M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
2074 GC AGTGT CT T C C CAT AAT C AC CAAGACAAGAAGGGAGT GAT T C GGGAAAGT T AC CT CAAA 2133 

1921 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 1980 

| | M II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2134 GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 2193 

1981 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 2040 

| | | M | | | I II I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I 

2194 ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 22 53 

2 041 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2100 

| | M | | | M I I I I I I I I I I I I I I I I I I I I I I I I M M I I II I I I I I I I I I I I I I I I I I I I 

2254 GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 2313 

2101 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAT^AGACCCAAAGCCGGAG 2160 

| | | | | I I I I I I M I I I I I I I I I M I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
2 314 AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 2373 

2161 GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGC7VACACGGCCAAG 2220 

II I I M I I I I I I I I I II I I I I I I I I I I I I I I I I MM I 

237 4 GC CAT C CT CAC GC CACT C AT GC ACAAC GGCAAGCT C G C CACT C CC GGCAACAC GGC CAAG 2433 

2221 AT GCT CAT TAAAG C AGAC CAGC AC CACCT GGAC CT GAC GGC C CT C C CC AC CCCAGAGT C A 22 80 

I | | | | | | II II I I II I I M I II II I M II II II II II I II I I II I II II II I M II I I I I 
2434 AT GCT CATTAAAG C AGAC CAGCAC CACCT GGAC CT GAC GGC C CT C C CC AC C C CAGAGT C A 2 4 93 

22 81 AC CC CAAC GCT GCAGCAGAAG C G GAAGC C CAGC CG C GGCAG C C GCGAGT GGGAGAGGAAC 2340 

I I I I II M M II I II II I I II II I I M M M I II I II I MUM 

2494 AC CC CAAC GCT GCAGCAGAAG C GGGAAC C CAGC C GC GGCACC C GC GAGT GGGAGAGGAAC 2553 

2 341 CAGAACCT CAT CAAT GC CT G CACAAAGGACAT GC C C CC CAT GGGCT CC C CT GT GAT T C C C 24 00 

I | || | | | | || II I II II I I I II M II II I M I I I I II II I I II II II II I II II II II M 
2554 CAGAACCT CAT CAAT GC C T GCACAAAGGAC AT GC C C CC CAT GGGCT C C C CT GT GAT TC C C 2 613 

24 01 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 24 60 

I | | | | || || II I I II II I I I M II I II M II II I II I II I II I I M II I II M I II II I I 

2614 ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 2 673 

2461 ACGC AGCAGGGCT AC CAGCAT GAGT AC GT GGAC C AGC C C AAAAT GAGC GAGGT GG C C CAG 2520 

|| || || II II II I I II M II II M I II II I I II I I II II I I I II I II II I II II I I II II 
2 674 AC GCAGCAGGGCT AC CAGCAT GAGT AC GT GGACC AGC CCAAAAT GAGC GAGGT GGCC CAG 2733 

2 521 AT GG C GCT GGAGGAC C AGGC C GC CACACT GGAGT AT AAGAC CAT CAAG GAACAT CT CAGC 2580 

| | II | || || || || II II II II I I II II I I II II I II M II M II II II II II II II II I I 
2734 AT GGC GCT GGAGGAC CAGGC C GC CAC ACT G GAGT AT AAGAC CAT CAAG GAACAT CT C AGC 2793 

2 581 AGCAAGAGTC C CAACCAT G GGGT GAAC CTT GT GGAGAACCT GGACAGC CT G C C C C CCAAA 264 0 

I | | | | | | || M I I I I I II I I M I II II I I II II M II I II I II I I I II II I II M I II I I 

2794 AGCAAGAGTC CCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAA 2853 
2 641 GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2700 



Db 


2854 


Qy 


2701 


Db 


2914 


Qy 


2761 


Db 


2974 


Qy 


2820 


Db 


3034 


Qy 


2879 


Db 


3094 


Qy 


2939 


Db 


3154 


Qy 


2999 


Db 


3214 


Qy 


3059 


Db 


3274 



I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I M I I II II I I I I I I II I I M I I I I I I 

GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 2913 
AGCAAGC GGCTGGAAAT GCACCACT CCT CTT CCT ACGGGGTT GACTATAAGAGGAGCTAC 2760 

I I I I I I I I I I I I I I I I II I I I ! I I I I I I I I M I I I I I I I I I I II I I I I I I II M I I I I I I 

AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 2973 



M I II I I I I I I I I I I I I I I M I I I I II I I I I I II I I ! I I I I I I I I I I I I I I I I I 

CC C AC GAACT CGCT C AC GAGAAG C CAC C T GAC C AC CT ACT CT CAT CAGAAGCAACACT AA 3033 

CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 2878 

IN M I I I I III M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CC C C GACAATT CAN C T CT GACT T CAAAGGGAC CAGAGCT T T GGC AGGG GAGACAAC CC GC 3093 

CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 2938 

| | | I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I 

CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 3153 

CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 2998 
| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 3213 

TGAAGCGTACGCCCTCGCTA7VAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3058 

I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 3273 

CCACATCCATGAAGCCCAATGATGCGTGTACATAA 3093 
I I I I 1 I I I I I I I I I I I I I II I I I I I I I I I I II I I I 
CCACATCCAT GAAGCCCAAT GATGCGTGT ACATAA 3308 



RESULT 4 

US-10-449-548-31 

Sequence 31, Application US/10449548 
Publication No. US20040018977A1 
GENERAL INFORMATION: 
APPLICANT: Alvarez, Enrique 
APPLICANT: Anderson, David W. 
APPLICANT: Dhanabal, Mohanraj 
APPLICANT: Khramtsov, Nikolai V. 
APPLICANT: LaRochelle, William J. 
APPLICANT: Li, Li 
APPLICANT: Lichens tein, Henri 
APPLICANT: Ooi, Chean Eng 
APPLICANT: Padigaru, Muralidhara 
APPLICANT: Shimkets, Richard A. 
APPLICANT: Zhong, Mei 

TITLE OF INVENTION: SEMAPHORIN-LIKE PROTEINS AND METHODS OF USING SAME 
FILE REFERENCE: 15966-540CIP2 
CURRENT APPLICATION NUMBER: US/10/449,548 
CURRENT FILING DATE: 2003-05-30 
PRIOR APPLICATION NUMBER: 09/520,781 
PRIOR FILING DATE: 2000-03-03 
PRIOR APPLICATION NUMBER: 60/123,667 
PRIOR FILING DATE: 1999-03-09 
PRIOR APPLICATION NUMBER: 60/234,082 



PRIOR FILING DATE: 2000-09-20 
PRIOR APPLICATION NUMBER: 60/233 f 798 
PRIOR FILING DATE: 2000-09-19 
PRIOR APPLICATION NUMBER: 60/174,485 
PRIOR FILING DATE: 2000-01-04 
PRIOR APPLICATION NUMBER: 10/403,676 
PRIOR FILING DATE: 2003-03-31 
PRIOR APPLICATION NUMBER: 60/371,002 
PRIOR FILING DATE: 2002-04-09 
PRIOR APPLICATION NUMBER: 60/384,798 
PRIOR FILING DATE: 2002-05-30 
PRIOR APPLICATION NUMBER: 60/402,407 
PRIOR FILING DATE: 2002-08-09 
PRIOR APPLICATION NUMBER: 60/443,062 
PRIOR FILING DATE: 2003-01-28 
NUMBER OF SEQ ID NOS : 5 8 
SOFTWARE: CuraSeqList version 0.1 
SEQ ID NO 31 
LENGTH: 34 98 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (214) . . (3030) 
FEATURE: 

NAME/KEY: misc_f eature 
LOCATION: (3047) . . (3047) 

OTHER INFORMATION: Wherein n may be a, c, g or t 
US-10-449-548-31 

Query Match 98.2%; Score 3038; DB 15; Length 3498; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 3072; Conservative 0; Mismatches 21; Indels 2; Gaps 2; 

ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I | | | | | M | I I I I II I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I M 

ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 273 

C C AGAAGAT T CT GAGC CAAT C AGT AT TT C GC AT GGCAACT AT ACAAAACAGT AT C C GGT G 12 0 

I I I I I I I I I I I I I I I I I M I I I II I I I M I II I I I I II I II I I I I I I II I I I I I I I I I II 

C CAGAAGAT T CT GAGCCAAT CAGT AT T T C GC AT GGCAACT AT ACAAAACAGT AT C C GGT G 333 

TTT GT GGGCCACAAGCCAGGAC GGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 18 0 

M I I I I I I I M I I I I I I I I I I I I M I I I I I II I I I M I I M I I Ill I I M 

T T T GT GGGC C ACAAG C C AGGAC GGAAC AC CACACAGAGGCACAGGCT GGAC AT CCAGAT G 393 

ATTAT GAT CATGAAC GGAACC CTCTACATTGCTGCTAGGGACCAT ATTTAT ACT GTT GAT 240 

I | I I I II M I II II I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I i I I M I I I I I I 
ATTAT GAT CAT GAAC GGAACCCTCTACATT GCTGCTAGGGAC CAT ATTTAT ACT GTT GAT 4 53 

ATAGACACAT CACACACGGAAGAAATTTATT GTAGCAAAAAACT GACAT GGAAAT CTAGA 300 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I 
ATAGACACAT CACACAC GGAAGAAATT TAT T GTAGCAAAAAACT GACAT G GAAAT CTAGA 513 

CAG GCC GAT GT AGACAC AT GCAGAAT GAAGG GAAAAC AT AAGGAT GAGTG C CACAACT T T 360 

I | II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I II M I I 

CAG GCC GAT GT AGACAC AT GCAGAAT GAAGGGAAAAC AT AAGGAT GAGT GC CACAACT T T 573 



Qy 


1 


Db 


214 


Qy 


61 


Db 


274 


Qy 


121 


Db 


334 


Qy 


181 


Db 


394 


Qy 


241 


Db 


454 


Qy 


301 


Db 


514 



Qy 


361 


AT TAAAGT T CT T CT AAAGAAAAAC GAT GATGCAT TGTTTGTCTGT GGAACTAAT G C C T T C 


420 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i ! 1 ! 1 1 1 1 1 1 1 1 E 1 1 1 II 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 
i i i i i i ] i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i t i i I i i i ■ t ' ■ 1 ■ 




Db 


574 


ATTAAAGTTCTTCTAAAGAAAAAC GAT GATGCAT TGTTTGTCTGT GGAACTAAT GCCTTC 


633 


Qy 


421 


AAC CCTT CCT GCAGAAACTATAAGAT GGATACATT GGAACCATTCGGGGAT GAATT CAGC 


480 




i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 I 1 1 1 1 1 1 II 
l l l I I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i * i i i ■ ■ ■ * 




Db 


634 


AACC CTT CCT GCAGAAACTATAAGATGGATACATT GGAACC ATT CGGGGAT GAATT CAGC 


693 


Qy 


481 


G GAAT GGC CAGAT GC CCAT AT GAT GC CAAACAT GC CAAC GT T GCACT GT TT GCAGAT GGA 


540 




1 1 1 t 1 1 t 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 l l l l 1 1 l l l l l l l i i i i i i i i i i i i i i i i i i i 




Db 


694 


GGAAT GGC CAGAT GC C CAT AT GAT GCCAAAC AT G C CAAC GT T G C ACT GT T T GCAGAT GGA 


753 


Qy 


541 


AAACT AT ACT CAGC CACAGT GACT GACT T CCTT GC CAT T GAC GCAGT CAT T T AC C GGAGT 


600 




1 t II 1 1 ! 1 [ 1 1 i t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 l l l I I I I I t I I I I i I i i i I i i i i i i i i i > i i i i i i i i i i i i i i i i 




Db 


754 


AAACTAT ACT CAG C CACAGT GACT GACT T C CTT G C CAT T GAC G CAGT CATTT AC C GGAGT 


813 


Qy 


601 


CTT GGAGAAAGCC CT AC C CT G C GGACC GT CAAG C AC GAT T CAAAAT G GTT GAAAGAAC CA 


660 




I I I I I I i I I I 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 ! 
1 1 M M 1 M 1 M M II M M M M II II II II II I M M M l ll ll M l ll M i M i i M 




Db 


814 


CTT GGAGAAAGCCCTACCCTGCGGACC GTCAAGCACGATT CAAAATGGTT GAAAGAAC CA 


873 


Qy 


661 


TACTTTGTTCAAGCCGT GGAT TACGGAGATTATATCTACTT CTT CTT CAGGGAAATAGCA 


720 




I I I l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 
I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 l l l l l l ll l l l I I I I I I i i i i i i i i i i i i i i i i 




Db 


874 


T ACT TT GT T CAAGC CGT G GAT TAC G GAGAT TAT AT CT ACT T CT T CTT CAGGGAAAT AGCA 


933 


Qy 


721 


GT GGAGT AT AACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT GGCT C AGGT T T GT AAGAAT 


780 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 

| I I I I I I I I I I 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


934 


GT GGAGT AT AACAC CAT GGGAAAGGT AGTT TTC C CAAGAGT GGCT C AGGT TT GT AAGAAT 


993 


Qy 


781 


GAT AT G GGAGGAT CT CAAAGAGT C CT G GAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GC 


840 




l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 l l l l l l i I I I I I I I I I i i i i i i i i i i i ii i 




Db 


994 


GAT AT GG GAGGAT CT CAAAGAGT CCT GGAGAAAC AGT G GAC GT C GT T C CT GAAG G C GC GC 


1053 


Qy 


841 


TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 


900 




1 1 1 i 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 
I I 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l l I I I I I I I I I i I i i i i i i i i i i i > i i i i i i i 




Db 


1054 


TT GAACT GCT CAGT T C CT GGAGACT CT CAT T TT T AT T T CAACAT T CT C CAGGC AGT TAC A 


1113 


Qy 


901 


GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


960 




I l l l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 
I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 i i i i i i i i i i i i i i i i i i i i i i i 




Db 


1114 


GAT GT GATT C GT AT CAACGGGC GT GAT GT T GT C CT GGCAAC GT T TT CT ACAC CT T AT AAC 


1173 


Qy 


961 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1020 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

| | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1174 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1233 


Qy 


1021 


GGGAGAT T CAAG GAACAGAAGT CT C CT GAT T C C AC CT GGACAC CAGT T C CT GAT GAACGA 


1080 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I I I I I 




Db 


1234 


G GGAGATT CAAGGAACAGAAGT CT C CT GATT CC AC CT G GACAC CAGT T C CT GAT GAACGA 


1293 


Qy 


1081 


GT T CCTAAGCCCAGGCCAGGTT GCT GT GCT GGCT CAT CCT CCTTAGAAAGAT AT GCAACC 


1140 




I | | | | | | | | 1 1 II 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 M 1 1 1 U 1 1 1 1 1 1 1 1 1 




Db 


1294 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGA7\AGATATGCAACC 


1353 


Qy 


1141 


T CCAAT GAGTT CCCT GAT GAT ACCCT GAACTT CAT CAAGACGCACCCGCT CAT GGAT GAG 


1200 




I || | 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 M 1 




Db 


1354 


T C CAAT GAGTT C CCT GAT GAT AC CCT GAACT T CAT CAAGAC G CAC C C GCT CAT GGAT GAG 


1413 



Qy 


1201 


GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 


1260 




M | 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 






1414 

14 14 


G CAGT G C C CT C CATCTT CAACAGGC CAT GGTT C CT GAGAACAAT G GT C AGAT ACC G C CT T 


1473 


Qy 


1261 


ACCA/WlTTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 


1320 




1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 






1474 

X. *i / *i 


AC CAAAAT T GC AGT GGAC ACAGCT GCT GGG CC AT AT CAGAAT CAC ACT GT G GT T T T T CT G 


1533 


Qy 


1321 


GGATCAGAGAAGGGAATCATCTTGAAGTTTTTGGCCAGAATAGGAAATAGTGGTTTTCTA 


1380 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 I 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 






1 RQ/l 
1 JJn 


CC A T r A C A C A A CC C A AT C AT C T T GAAGT T T TT G GC CAGAAT AGGAAAT AGT GGTTT T CT A 


1593 


Qy 


1381 


AATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTACAACTCTGAAAAATGCAGCTATGAT 


1440 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 






1 RQ 4 


A ATr AP A^rrTTTTPPTGrrAGGAGATGAGT GTTTACAACTCTGAAAAATGCAGCTATGAT 


1653 


Qy 


1441 


GGAGTCGAAGACAAAAGGATCATGGGCATGCAGCTGGACAGAGCAAGCAGCTCTCTGTAT 


1500 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DO 


1 R /I 
1 DO 4 


ppaptpp A apap A AAAr^ATPATPTG^PATGPAGCTGGACAGAGCAAGCAGCTCTCTGT AT 


1713 


Qy 


1501 


GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


X / -L 4 


rTTrrrTTrTrTArrTnTRTQATAAAnnTTCfCCTTGGCCGGTGTGAACGACATGGGMG 


1773 


Qy 


1561 


TGTAAAAAAACCTGTATTGCCTCCAGAGACCCATATTGTGGATGGATAAAGGAAGGTGGT 


1620 




I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Dd 


X / / 4 


t r t a a A A A A A c c T r:T AT T C C C T C C A Pr A C A P P C AT AT T GT CC AT GGATAAAGGAAGGT GGT 


1833 


Qy 


1621 


GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 


1680 




1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


1 P ^ 4 


rrrTrnxcrr ATTTATPAPPPAAPAGPAGAPTGAPTTTTGAGCAGGACATAGAGCGTGGC 


1893 


Qy 


1681 


AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGAATGGGCATTCCAGT 


1740 




I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 






1 ft Q 4 


a ATAPAPATPnTPTPPf^PrAPTfTTPAPAATTPPTTTGTGGCACTGAATGGGCATTCCAGT 


1953 


Qy 


1741 


TCCCTCTTGCCCAGCACAACCACATCAGATTCGACGGCTCAAGAGGGGTATGAGTCTAGG 


1800 




1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Dd 


x y D4 


TrrrTrTTrrrrAnfAfA APPAPATPAGATTPGACGGCTCTVAGAGGGGTATGAGTCTAGG 


2013 


Qy 


1801 


GGAGGAATGCTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 


1860 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 








rr A(^r^AATr;rTr4n APTnr; A AGCATrTGCTTGACTCACCTGACAGCACAGACCCTTTGGGG 


2073 


Qy 


1861 


GCAGTGTCTTCCCATAATCACCAAGACAAGAAGGGAGTGATTCGGGAAAGTTACCTCAAA 


1920 




1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 




nk 


9 07 4 


cr A CT CT r TT r r r AT a at c a c C A AG AC AAGAAGGGAGT GAT T CGGGAAAGTT AC CT CAAA 


2133 


Qy 


1921 


GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 


1980 




I I I I I I I I I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 






91 "34 


GGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTC 


2193 


Qy 


1981 


ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 






I M M | || | 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


2194 


ATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGAC 


2253 


Qy 


2041 


GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 


2100 



Db 


2254 


GTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGC 


2313 


Qy 


2101 


AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 


2160 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 I 1 1 1 1 1 1 1 1 1 1 1 
I i i i i i i i i i i i i i i i i i ( i i i i i i i i i i i i i i i i t i i i i i i i i i i i ■ i i i i t ■ 1 1 1 ■ 1 • 




Db 


2314 


AGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAG 


2373 


Qy 


2161 


GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


2220 


Db 


2374 


I I I I 1 I I M M 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 N 1 1 1 1 1 1 I! 1 1 1 1 M 1 1 

GCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAG 


2433 


Qy 


2221 


AT GCT CAT T AAAGCAGAC C AGC ACC AC CT GGAC C T GACGGCC CT C C C CAC CC C AGAGT C A 


2280 




1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 
1 1 1 1 1 1 1 1 1 1 l l l l l I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


2434 


AT GCT CATT AAAGCAGAC C AG C ACC AC CT G GAC CT GACGGCC CT C C C C AC CC C AGAGT CA 


2493 


Qy 


2281 


ACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAAC 


2340 




1 1 1 II 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 l ll I I I I I i i i i 1 i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i t i 




Db 


2494 


ACCCCAACGCTGCAGCAGAAGCGGGAACCCAGCCGCGGCACCCGCGAGTGGGAGAGGAAC 


2553 


Qy 


2341 


CAGAACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 


2400 




i I ll I I I I I i l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
I I I I I 1 1 1 ! H 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l l l l l l i i i 




Db 


2554 


CAGAACCTCATCAATGCCTGCAC7WVGGACATGCCCCCCATGGGCTCCCCTGTGATTCCC 


2613 


Qy 


2401 


ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 


2460 




1 1 1 1 1 1 1 M M 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
| I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2614 


ACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATC 


2673 


Qy 


2461 


AC GC AGC AG GGCT AC CAG CAT GAGT ACGT GGAC C AGCC CAAAAT GAGCGAGGT GG C C C AG 


2520 




1 ! II 1 1 1 1 1 1 1 II l l 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 I II 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 
I 1 I I 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 1 1 1 1 i i i i i i i i i i i i i i i i i i i 




Db 


2674 


AC GCAGCAGGGCTAC CAGCAT GAGT ACGT GGACCAGCCCAAAATGAGCGAGGT GGCCCAG 


2733 


Qy 


2521 


AT GGC GCT GGAG GAC CAG G CC G CCACACT GGAGT AT AAGAC CAT CAAG GAAC AT CT CAGC 


2580 




l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
| | | I I M M 1 1 1 1 1 1 1 1 1 II 1 M 1 1 1 I 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 l 1 1 M 1 1 




Db 


2734 


AT GGC GCT G GAGGAC CAGGC C GCCACACT GGAGTAT AAGAC CAT CAAGGAAC AT CT CAGC 


2793 


Qy 


2581 


AGCAAGAGT C C CAAC CAT G GGGT GAAC CT T GT GGAGAAC CT GGAC AGC CT GC C C C C CAAA 


2640 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 EE 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

I 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II I 1 I I I l I I I I 




Db 


2794 


AGCAAGAGT C C CAAC CAT G GG GT GAAC CTT GT GGAGAAC CT G GACAG CCTGCCCCC CAAA 


2853 


Qy 


2641 


GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 


2700 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 
1 1 1 l l l l l l l l l l l l i i i i i i i i i i i i i f i i i i i i i i i i i i i i i i i i i i i < i i i i i i i i ■ 




Db 


2854 


GTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTA 


2913 


Qy 


2701 


AGC AAGC GGCT GGAAAT GCACCACT CCT CTT CCT ACGGGGT T GACT AT AAGAGGAGCT AC 


2760 




1 ! 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

| 1 I I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 




Db 


2914 


AGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTAC 


2973 


Qy 


2761 


C CC AC GAACT C GCT CAC GAGAAG C CAC CAGGCC AC C - ACT CT CAAAAGAAACAACACTAA 


2819 




1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 II 1 
I I 1 1 1 1 1 1 1 1 1 1 1 I I I I I i i i i i i i i ii i i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


2974 


C CCAC GAACT C GCT CAC GAGAAG C CAC CT GAC CAC CT ACT CT CAT C AGAAG CAACACT AA 


3033 


Qy 


2820 


CTCCTCCAATTCCTCTC-ACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGC 


2878 




IN MINI III II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 II 




Db 


3034 


C C C C GACAAT T CAN CT CT GACTT CAAAGGGACC AGAGCTT T GGCAGG GGAGACAACC C GC 


3093 


Qy 


2879 


CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 


2938 



I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 



Db 



3094 CGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGG 3153 



Ov 


2939 


CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 

II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 

CCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGC 


2998 


Db 


3154 


3213 


Qy 

Db 


2999 
3214 


TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCATUVCCATCCTTTGCTCCCCTTT 

I | | 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M i 

TGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTT 


3058 
3273 


Qy 


3059 


C C AC AT C CAT GAAG C C C AAT GAT G C GT GT AC AT AA 3093 
I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCACAT C CAT GAAGCCCAATGAT GCGT GTACATAA 3308 




Db 


3274 





RESULT 5 

US-10-403-676-27 
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Publication No. US2004 0029150A1 
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APPLICANT: Gasman, Stacie J. 

APPLICANT: Edinger, Shlomit R. 

APPLICANT: Gerlach, Valerie L. 

APPLICANT: Grosse, William M. 

APPLICANT: Guo, Xiaojia 

APPLIC7\NT: Gusev, Vladimir Y. 

APPLICANT: Ji, Weizhen 

APPLICANT: LaRochelle, William J . 

APPLICANT: Lepley, Denise M. 

APPLICANT: Li, Li 

APPLICANT: Liu, Xiaohong 

APPLICANT: MacDougall, John R. 

APPLICANT: Malyankar, Uriel M. 

APPLICANT: Millet, Isabelle 

APPLICANT: Padigaru, Muralidhara 

APPLICANT: Patturajan, Meera 

APPLICANT: Peyman, John A. 

APPLICANT: Rastelli, Luca 

APPLICANT: Reiger, Daniel 

APPLICANT: Rothenberg, Mark E. 

APPLICANT: Shimkets, Richard A. 

APPLICANT: Stone, David J. 

APPLICANT: Taupier, Raymond J. 

APPLICANT: Vernet, Corine 
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THERAPEUTIC POLYPEPTIDES, NUCLEIC ACIDS ENCODING SAME, 



APPLICANT: 
TITLE OF INVENTION: 
AND METHODS OF USE 

FILE REFERENCE: 21402-573B 

CURRENT APPLICATION NUMBER: US/10/403, 676 
CURRENT FILING DATE: 2003-03-31 
PRIOR APPLICATION NUMBER: 60/123,667 
PRIOR FILING DATE: 1999-03-09 
PRIOR APPLICATION NUMBER: 09/520,781 



; PRIOR FILING DATE: 2000-03-08 

; PRIOR APPLICATION NUMBER: 09/957,187 

; PRIOR FILING DATE: 2001-09-19 

; PRIOR APPLICATION NUMBER: 60/371,002 

; PRIOR FILING DATE: 2002-04-09 

; PRIOR APPLICATION NUMBER: 60/127,352 

/ PRIOR FILING DATE: 1999-04-01 

; PRIOR APPLICATION NUMBER: 09/538,092 

; PRIOR FILING DATE: 2000-03-29 

; PRIOR APPLICATION NUMBER: 09/604,286 

; PRIOR FILING DATE: 2000-06-22 
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; PRIOR FILING DATE: 1999-06-23 
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; PRIOR FILING DATE: 2002-04-05 

; PRIOR APPLICATION NUMBER: 60/384,297 

; PRIOR FILING DATE: 2002-05-30 

; Remaining Prior Application data removed - See File Wrapper or PALM. 
; NUMBER OF SEQ ID NOS : 17 9 
; SOFTWARE: CuraSeqList version 0.1 
; SEQ ID NO 27 
; LENGTH: 3055 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (2) . . (3055) 
US-10-403-676-27 

Query Match 98.2%; Score 3037.6; DB 12; Length 3055; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 3040; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 47 CTGGGGCTGGTTTCCCAGAAGATTCTGAGCCAATCAGTATTTCGCATGGCAACTATACAA 106 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3 C C GGAT C C GGT TT C CC AGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT GGCAACT ATACAA 62 

Qy 107 AAC AGT AT CC GGT GTTT GT GGGC C ACAAGC CAGGAC GGAAC AC CACACAGAGGC ACAGGC 166 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

63 AAC AGT AT C C G GT GTTT GT GG GC C ACAAG C CAGGAC G GAAC AC CACACAGAGGC ACAGGC 122 



Db 



167 T GGACAT CCAGAT GAT TAT GAT CAT GAAC GGAAC C CT CTAC AT T GCT G CT AGGGACC AT A 226 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
123 T GGACAT CCAGAT GATT ATGATCAT GAACGGAACCCT CTACATTGCT GCTAGGGACCATA 182 



QY 



227 T T TAT ACT GT T GAT AT AGAC ACAT C AC ACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GA 286 




Db 



183 T T TAT ACT GT T GAT AT AGAC ACAT C AC ACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GA 242 



QY 



Db 



287 CAT G GAAAT CT AGACAGG C C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAG GAT G 346 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I 
2 43 CAT G GAAAT CT AGACAGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAG GAT G 302 



Qy 

Db 



347 
303 



406 
362 



Qy 4 07 GAACT AAT GC CT T CAACC CT T C CT GC AGAAAC T AT AAGAT GGAT ACATT GGAACC AT T C G 4 66 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 363 GAACTAAT G CCT T CAAC C CT T C CT GCAGAAACT AT AAGAT G GATACAT T GGAACC AT T C G 422 

Qy 467 GGGAT GAATTCAGCGGAAT GGC CAGATGCCCATAT GAT GCCAAACATGC CAACGTT GCAC 526 

I I I I M I II I I I I I I I I I I I II I I I I I I I I I I I I I I I | | || | | | | | | | | | | M | | | | | | | 
Db 423 GGGAT GAAT T C AGCGGAAT GGC CAGAT GC C CAT AT GAT GC C AAACAT GC CAAC GTT GCAC 4 82 

Qy 527 T GT TT G CAGAT GGAAAACT AT AC TCAGC C ACAGT GACT GACT T CCT T GC CAT T GAC GC AG 586 

I I M I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I M I I I I I I I 
Db 483 T GT TT GCAGAT G GAAAACT AT ACT CAGC C ACAGT GACT GACT T C CTT GC C AT T GAC GCAG 542 

Qy 587 T CATT T AC C GGAGT CT T GGAGAAAGC C CT AC C C T GC GGAC CGT CAAG CAC GAT T CAAAAT 646 

I I I I I I I I I I I I M M I I I I I I I I M I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 543 T C ATTT AC C GGAGT C T TGGAGAAAGC C CT ACC CT GC G GAC CGT CAAGCAC GATT CAAAAT 602 

Qy 647 G GT T GAAAGAACCAT ACTT T GTT CAAGCC GT GGAT T AC GGAGAT TAT AT CTACT T CT TCT 706 

I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I I I I I I I I 
Db 603 GGT T GAAAGAAC CAT ACT T T GT T CAAG C C GT GGAT T ACGGAGAT TAT AT CT AC T TC TT CT 662 

Qy 707 T CAGGGAAAT AG CAGT GGAGT AT AAC ACCAT GGGAAAGGT AGT T T T C CCAAGAGT GGCT C 766 

I I I I I II I I II I I I I I I I II I I I I I I I I I I I I I I I I I || | | | | | | M I I I I I I I I I I I I I 
Db 663 T CAGGGAAAT AGCAGT GGAGTATAAC ACC AT G G GAAAGGTAGT T T T C CCAAGAGTGGCT C 722 

Qy 767 AGGTTT GTAAGAATGATAT GGGAGGAT CT CAAAGAGT CCTGGAGAAACAGT GGACGTCGT 82 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I M I II 
Db 723 AGGTTT GTAAGAAT GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGACGT CGT 782 

Qy 827 TCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTC 88 6 

I I I I I M I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
Db 783 T C CT GAAGGC GC GCT T GAACTGCT CAGTT C CT G GAGACT CT C AT TT T TAT T TCAACAT T C 842 

Qy 887 TCCAGGCAGTTACAGATGT GATT CGTATCAACGGGCGT GAT GTTGTCCTGGCAACGTTTT 94 6 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | 
Db 843 TC CAG G CAGT TAC AGAT GT GAT T C GT ATCAAC GGGC GT GAT GT T GT C CT GGCAAC GT T TT 902 

Qy 947 CTACAC CTTATAACAGCAT CCCT GGGT CTGCAGT CTGTGCCTAT GACATGCTT GACATTG 1006 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | I | | | | | | | 
Db 903 CTACAC CTT AT AAC AGCAT CCCTGGGTCT GCAGT CT GT G CCT AT GACAT GCTT GAC AT T G 962 

Qy 1007 CC AGT GT TT T TAC T GGGAGAT T CAAGGAAC AGAAGT CT C CT GATT C C ACCT GGACAC CAG 1066 

I M I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M | I | M II I I 

Db 963 C CAGT GT T T T TACT G G GAGAT T CAAGGAAC AGAAGT C T C CT GAT T C CACCT GGACAC CAG 1022 

Qy 1067 TTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAG 112 6 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M I I I I I I 
Db 1023 TTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAG 1082 

Qy 1127 AAAG AT AT G CAAC C T C C AAT GAGT T C C C T GAT GAT AC CCT G AAC T T CAT CAAG AC G CAC C 1186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I II I I I I I II I I 

Db 1083 AAAGAT AT GCAAC CT C CAAT GAGT T C C CT GAT GAT AC CCT GAACTT CAT CAAGAC GC ACC 1142 

Qy 1187 C GCT CAT GGAT GAGG CAGT GC C CT CC AT CTT CAACAGG C CAT GGTT C CT GAGAACAAT GG 1246 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1143 CGCT CAT GGAT GAGGC AGT GC C CT CC AT CTT CAAC AG G C CAT G GTT C C T GAGAACAAT GG 1202 



Qy 12 47 TCAGAT ACCGCCTT AC CAAAATT GCAGTGGACACAGCT GCT GGGCCATAT CAGAATCACA 1306 



Db 12 03 T CAGATACCGCCTTACCAAAATT GCAGT GGACAC AGCT GCTGGGCCATAT CAGAATCACA 1262 

Qy 1307 CTGTGGTTTTTC T GGGAT CAGAGAAGGGAAT CAT CTT GAAGTTT T T GG C CAGAAT AG GAA 1366 

I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 12 63 CT GT G GT T TT T CT GG GAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GG C CAGAAT AGGAA 1322 

Qy 1367 AT AGT GGT TT T CT AAAT GAC AGC C T TT T CCT GGAGGAGAT GAGT GT T T ACAACT C T GAAA 142 6 

I I I I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1323 AT AGT GGT TT T CT AAAT GAC AGC CT TT T CCT GGAGGAGAT GAGT GT T T ACAACT CT GAAA 1382 

Qy 1427 AAT GCAGCTAT GAT G GAGT C GAAGACAAAAGGAT CAT GG GC AT GC AG CT GGAC AGAGCAA 1486 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1383 AAT GCAG CTAT GAT G GAGT C GAAGACAAAAGGAT CAT G G GCAT GC AGCT GGACAGAG CAA 1442 

Qy 14 87 GCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTG 154 6 

I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 GCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTG 1502 

Qy 1547 AAC GAC AT GG GAAGT GTAAAAAAAC CT GT ATT GC CT C C AGAGAC C CAT ATT GT G GAT GGA 1606 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I 
Db 1503 AACGACAT GGGAAGT GTAAAAAAACCT GTATTGC CTCCAGAGACCCATATT GTGGATGGA 1562 

Qy 1607 TAAAGGAAGGT GGT GCCT GCAGCCATTTAT CACC CAACAGCAGACTGACTTTTGAGCAGG 1666 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1563 TAAAGGAAGGT GGT GCCT GCAGCCATTTAT CACC CAACAGCAGACT GACTTTTGAGCAGG 1622 

Qy 1667 ACATAGAGCGTGGCAATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGA 1726 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 ACATAGAGCGTGGCAATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGA 1682 

Qy 1727 AT GGGCAT T C C AGTT CCCTCTTGCC CAGCACAAC CACAT C AGAT T C GAC GGCT CAAGAGG 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1683 AT GGGCAT TC C AGT T C C CT CT T G C C CAGCACAAC CACAT C AGAT T CGAC GG CT CAAGAGG 1742 

Qy 1787 GGT AT GAGTCT AGGGGAGGAAT GCT GGACT GGAAGCAT CTGCTT GACT CACCTGACAGCA 1846 

I I I I I I I I II I I I I II I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1743 GGT AT GAGTCT AGGGGAGGAAT GCT GGACT GGAAGCAT CTGCTT GACT CACCTGACAGCA 1802 

Qy 1847 CAGAC C CT TT GGG GGCAGT GT CT T C CCAT AAT CAC CAAGACAAGAAG G GAGT GAT T C GG G 1906 

I I I I I I II I I I I I I I I I I I II M I I I I I I I I I I I I I I II I I II I I I I I I I I I I II I II I I 
Db 18 03 CAGAC C CT TT GGG GGCAGT GT CT T C C CAT AAT CAC CAAGACAAGAAG G GAGT GAT T C GGG 1862 

Qy 1907 AAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCA 1966 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II 
Db 1863 AAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCA 1922 

Qy 1967 TCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATC 202 6 

I I I I I I I I I I M I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1923 TCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATC 1982 

Qy 2027 AT C GGC GCAAAGAC GT GGCT GT GGT GC AGC G CAAGGAGAAGGAG CT CAC C C ACT C GC G C C 2086 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1983 ATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCC 2 042 

Qy 2 087 GGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAG 214 6 

II I I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I II I I II I I I I I I I I I I II I I I I 



Db 



2 043 GGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAG 2102 



Qy 2147 ACCCAAAGCCGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCG 2206 

M I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2103 ACCCAAAGCCGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCG 2162 

Qy 22 07 GCAACAC GGC CAAGAT GCT C AT T AAAGCAGAC CAG CAC CAC C T GGAC CT GAC GGCC CT C C 2266 

I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 
Db 2163 GCAACAC GGC CAAGAT GC T CAT TAAAGC AGAC CAGCAC C AC CT GGAC C T GAC GG C CCT C C 2222 

Qy 22 67 CCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCG 232 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I 
Db 2223 CCACCCCAGAGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCG 2282 

Qy 2327 AGT GGGAGAGGAAC CAGAAC CT CAT CAAT GC CT G CACAAAGGACAT GC C C C C C AT GGGCT 2386 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I | | 
Db 2283 AGT GGGAGAG GAAC CAGAAC CT CAT CAAT GC CT GC ACAAAG GAC AT GC C CC C CAT GGGCT 2342 

Qy 2387 CCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGG 2446 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2343 CCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGG 24 02 

Qy 244 7 T GGT C CT G C C CAT C AC GCAGCAGGG CT AC CAGCAT GAGTAC GT G GAC CAGC C CAAAAT GA 2506 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2 4 03 T GGT C CT G C C CAT C AC GCAG C AGG GCT AC CAGCAT GAGTAC GT GGAC CAGC C CAAAAT GA 2462 

Qy 2507 GC GAG GT GGC C CAGAT GG C GC T GGAGGAC CAG GC C GC C ACACT GGAGT AT AAGAC CAT CA 2566 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I 
Db 24 63 GC GAG GT GGC C CAGAT G G C GCT GGAG GAC CAG GC C GC C ACACT GGAGT AT AAGAC CAT C A 2522 

Qy 2567 AGGAACAT C T CAGC AG CAAGAGTC C CAAC CAT GG GGT GAAC CT T GT GGAGAAC CT G GACA 2626 

I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 2523 AGGAACAT CT C AGC AGCAAGAGTC C CAAC CAT GGGGT GAAC C TT GT G GAGAAC CT G GACA 2582 

Qy 2 627 GCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGT 2686 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2583 GCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGT 2642 

Qy 2687 CTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACT 274 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 2643 CTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACT 2702 

Qy 27 47 AT AAGAGGAGCT AC C C C ACGAACT C GCT CAC GAGAAGC CAC CAG G C CAC CACT CT CAAAA 2 8 06 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 27 03 AT AAGAGGAGCTAC C C CAC GAACT C GCT CAC GAGAAGC CAC C AGG C CAC CACT CT CAAAA 2762 

Qy 2 8 07 G7VAACAACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGG 2 8 66 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II | | | || | | | | | | | | | | | 
Db 2763 GAAACAACACTAACT CCT C CAAT T CCT CT CAC CTCT CCAGAAACCAGAGCT TT GGCAGGG 2822 

Qy 2 8 67 GAGACAAC CCGCCGCCCGCCC C GCAGAG G GT GGACT CC AT C CAGGT GCACAGCT C C CAGC 2926 

I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
Db 2823 GAGACAAC CCGCCGCCCGCCCC GCAGAGG GT GGACT CC AT C CAGGT GCACAGCT C C CAG C 2 8 82 

Qy 2927 CATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACT^ACTCACTGA 2986 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 28 8 3 CATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGA 2942 



Qy 2 987 CAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCT 304 6 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2943 CAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCC7y\ACCATCCT 3002 

Qy 3047 TT G CT C C C CT T TC CAC AT CC AT GAAGCC CAAT GAT G C GT GT ACA 3090 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 
Db 3003 TTGCTCCCCTTTCCACATC CAT GAAGCC CAAT GAT GCGTGTACA 304 6 
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US-10-449-548-27 

Query Match 98.2%; Score 3037.6; DB 15; Length 3055; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 3040; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 47 CTGGGGCTGGTTTCCCAGAAGATTCTGAGCCAATCAGTATTTCGCATGGCAACTATACAA 106 

I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I 
Db 3 C CG GAT C C GGT T T C C C AGAAGATT CT GAGC CAAT CAGTAT T T C GC AT G GCAACT AT ACAA 62 

Qy 107 AACAGTAT CCGGT GTTT GTGGGCCACAAGC CAGGACGGAACACCACACAGAGGCACAGGC 166 

I I I I I I M I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 63 AACAGTATCCGGTGTTTGTGGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGC 122 

Qy 167 T GGACAT C C AGAT GAT TAT GAT CAT GAAC G GAAC C CT CT AC ATT GC T GCTAGGGAC CAT A 226 

II I I M I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | 

Db 123 TGGACAT C CAGATGATT ATGAT CAT GAACGGAAC CCT CTACATTGCT GCTAGGGAC CAT A 182 

Qy 227 TTTATACT GTT GAT ATAGACACAT CACACACGGAAGAAATTTATT GT AGCAAAAAACT GA 2 86 

I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I i I 
Db 183 T T TAT AC T GT T GAT AT AGAC ACAT CAC AC AC GGAAGAAATT TAT T GT AGCAAAAAACT GA 242 

Qy 2 87 CAT GGAAAT CT AGAC AGGC C GAT GT AGAC AC ATG C AGAAT GAAG GGAAAAC ATAAGGAT G 346 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | M I I I I I I I 
Db 24 3 CAT GGAAAT CT AGAC AGG C C GAT GT AGAC AC ATGC AGAAT GAAGGGAAAACATAAGGAT G 302 

Qy 347 AGT GC CACAAC T TT ATT AAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT T T GT CTGT G 4 06 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I M I I I I I I I I 

Db 303 AGT GC CACAACTTT AT TAAAGT TCT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT G 362 

Qy 4 07 GAACTAAT GCCT T CAAC C CTT C CT GCAGAAAC TAT AAGAT GGAT ACAT T GGAAC C ATT C G 4 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 363 GAAC T AAT GC CT T CAAC C CTT C CT GCAGAAACT AT AAGAT GGAT ACAT T GGAAC CATT C G 422 

Qy 4 67 GGGAT GAATT CAGCGGAATGGCCAGATGCCCATAT GAT GCCAAACATGCCAACGTTGCAC 526 

I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 423 GGGAT GAATT CAGC GGAATGGCCAGATGCCCATAT GATGCCAAACATGCCAAC GTT GCAC 4 82 

Qy 527 T GTT T GC AGAT GGAAAACT AT ACT CAGC C ACAGT GACT GACT T C CT TGC CAT T GAC GC AG 58 6 

I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 83 T GTT T G C AGAT GGAAAACT AT ACT CAGC CAC AGT GACT GACT T C CT T G C CAT T GAC GC AG 542 

Qy 587 T CAT T TAC C GGAGT CTT GGAGAAAGC CCT AC C CT GC GGACC GT CAAGCAC GAT T CAAAAT 646 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 543 T CAT T TAC C GGAGT CT T G GAGAAAG C CCT AC C CT GC G GACC GT CAAGCAC GAT T CAAAAT 602 

Qy 647 GGTT GAAAGAAC CAT ACT T T GT T CAAGC C GT GGAT T AC GGAGATT AT AT CT AC TT CT T CT 706 

I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I 
Db 603 GGTT GAAAGAAC CAT ACTT T GT T CAAGC C GT GGAT TAC GGAGATT AT AT CTACTT CT T CT 662 

Qy 707 T CAGGGAAAT AG CAGT G GAGT ATAACAC CAT GGGAAAGGT AGT TT T CC CAAGAGT G GC T C 7 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 663 T CAGG GAAAT AGCAGT G GAGT AT AACAC CAT GG GAAAG GT AGT TT T CC CAAGAGT GGCT C 722 

Qy 767 AG GTTT GTAAGAAT GAT AT GGGAG GAT C T C AAAGAGT C C T GGAGAAACAGT GGAC GT C GT 82 6 



Db 723 AGGTTT GTAAGAAT GATAT GGGAGGAT CT CAAAGAGTCCT GGAGAAACAGT GGACGT CGT 782 

Qy 827 TCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTC 886 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 783 TCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTC 842 

Qy 8 87 T C CAGGC AGT TAC AGAT GT GATT C GT AT CAACGGGC GT GAT GT T GT C CT GG CAAC GT TTT 946 

I I I I I I I I I I M II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | M 
Db 843 T C C AGG C AGT TAC AGAT GTGATT C GT AT CAAC GGGCGT GAT GT T GT C CT GGCAAC GT T T T 902 

Qy 947 CTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTG 1006 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M II I I I I II II I I I | I | | | | | | 
Db 903 C TAC AC CT T AT AAC AGCATC C CT GGGT C T GCAGT CT GT GC C TAT GACAT GCT T GACAT T G 962 

Qy 1007 C CAGT GTTTTTACT GGGAGATTCAAGGAACAGAAGTCT CCT GATT CCACCT GGACACCAG 1066 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I II I I I I M II I I i I I I I I 
Db 963 C CAGT GTT TTTACT GGGAGAT T CAAGGAAC AGAAGTCT CCT GAT T C CACCT GGACAC CAG 1022 

Qy 1067 TTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAG 1126 

I I I I I I I M I I II I II I I I I I I I I II I I I I I I I I M | M I I I I I I I I I I I II I I I I I I M 
Db 1023 TTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAG 1082 

Qy 1127 AAAGAT AT GCAAC CT C CAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GC AC C 1186 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | M | | | | | | | | | | | | | | | 
Db 1083 AAAGAT AT GCAACCT CCAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC C 1142 

Qy 1187 C GCT CAT GGAT GAG GCAGT G C C CT C CAT CTT CAACAG G C CAT GGT T C CT GAGAACAAT G G 124 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 114 3 C GC T CAT G GAT GAGG CAGT GC C CT C CAT CTT CAAC AGGC CAT GGT T CCT GAGAACAAT GG 1202 

Qy 1247 T CAGAT AC C GC CTT ACCAAAAT T GCAGT GGACAC AGCT GCT GGGC CAT AT CAGAAT CACA 1306 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 03 T CAGAT ACCGCCTT AC CAAAATTGCAGT GGACACAGCT GCT GGGCCATATCAGAAT CACA 1262 

Qy 1307 CTGTGGTTTTT CT GG GAT CAGAGAAGGGAAT CAT CTT GAAGT T TTT GGC CAGAAT AGGAA 1366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 63 CTGTGGTTTTTCTGGGATCAGAGAAGGGAATCATCTTGAAGTTTTTGGCCAGAAT AGGAA 1322 

Qy 1367 AT AGT GGT T T T CT AAAT GACAGCCT T TT CCT GGAG GAGAT GAGT GT TT AC AAC T CT GAAA 1426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I || I I I I I I 
Db 1323 AT AGT GGT T TT CT AAAT GACAG CCT T TT C CT GGAGGAGAT GAGT GT TT ACAACT CT GAAA 1382 

Qy 1427 AAT GCAGC TAT GAT G GAGT CGAAGACAAAAGGAT CAT GG GC AT GC AGCT GGACAGAGC AA 14 86 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 138 3 AAT GC AG CT AT GAT GGAGT C GAAGACAAAAGGAT CAT G GGCAT G CAGCT GGACAGAGCAA 1442 

Qy 1487 GCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTG 1546 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 GCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTG 1502 

Qy 1547 AAC GACAT GGGAAGT GT AAAAAAAC CT GT AT T GC CT CC AGAGAC C CAT AT T GT GGAT GGA 1606 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | || | | | | | | | | | | | || | | | | | | 
Db 1503 AACGACAT GGGAAGTGTAAAAAAACCTGTATTGCCT CCAGAGACC CAT ATTGT GGATGGA 1562 

Qy 1607 TAAAGGAAGGTGGTGCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGG 1666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1563 TAAAGGAAGGTGGTGCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGG 1622 

Qy 1667 ACAT AGAGC GT G GCAAT ACAGAT GGTCT GGGG GACT GT CACAAT T C CT T T GT GG CACT GA 1726 

I I I I I I I I M I I M I I I I I I I I I I I I I I I I M I I I II II I I I I I I I I I I I I I I I I I I I I I 
Db 1623 ACAT AGAGC GT GGCAAT ACAGAT G GT CT G GG GGACT GT CACAAT T C CT T T GT GGCACT GA 1682 

Qy 1727 AT GGG CAT T C C AGT T C C CT CT T GC C CAGCACAAC CACAT CAGAT T C GAC GGCT CAAGAG G 1786 

M II I I II I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | 
Db 1683 AT GG GCAT T CC AGT TCCCTCTTGCC CAGCACAAC CACAT CAGATT C GAC GGCT CAAGAGG 1742 

Qy 1787 GGTAT GAGT CT AGGGGAGGAAT GCT GGACT GGAAGCATCTGCTT GACT CACCT GACAGCA 184 6 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II | | | | | | M || | | | 

Db 1743 GGTAT GAGT CTAGGGGAGGAAT GCT GGACTGGAAGCAT CTGCTTGACTCACCT GACAGCA 1802 

Qy 1847 CAGAC C CT T T GGGGGC AGT GT CT T C C CATAAT CAC CAAGACAAGAAGGGAGT GAT T CG G G 1906 

I I I I I I M II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1803 CAGACCCTTTGGGGGCAGTGTCTTCCCATAATCACCAAGACAAGAAGGGAGTGATTCGGG 1862 

Qy 1907 AAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCA 1966 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1863 AAAGTTACCTCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCA 1922 

Qy 1967 TCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATC 2026 

I I I I M M I I II I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I | | | | | || | | | | | | | 
Db 1923 TCCTGGCTTTCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATC 1982 

Qy 2027 ATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCC 2 086 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 198 3 ATCGGCGCAAAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCC 2042 

Qy 2087 GGGGCTCCATGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAG 2146 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I II I I I M I I I I I I I I I I I 
Db 2043 GG GGCT C CAT GAG CAGCGT CAC CAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAG 2102 

Qy 2147 ACCCAAAGCCGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCG 22 06 

I I I I I I I I I I I II II I I I I I I M I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I M 
Db 2103 ACCCAAAGCCGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCG 2162 

Qy 2207 G CAAC ACGGC CAAGAT GCT CATT AAAG CAGAC CAG CAC CACCT GGAC CT GAC G GC C CT C C 22 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2163 G CAAC AC GG C CAAGAT GCT CATT AAAGCAGAC CAG CAC CACCT GGAC CT GAC GGC CCT C C 2222 

Qy 2267 C C ACC C CAGAGT CAAC CC CAAC GCT GCAG CAGAAGC GGAAGC C CAGC CGC GGC AGC C GC G 2326 

I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | M | | | | | 
Db 2223 C C ACC C CAGAGT CAAC CC CAAC G CT GCAGC AGAAGC G GAAGC C CAGC CGC GGC AGC C GC G 2282 

Qy 2327 AGT GGGAGAGGAACCAGAAC CT CAT CAAT GCCTGCACAAAGGACAT GCCCCCC ATGGGCT 238 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2283 AGT GGGAGAGGAACCAGAACCTCAT CAAT GCCTGCACAAAGGACAT GCCC CC CATGGGCT 2342 

Qy 2387 CCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGG 24 46 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2343 CCCCTGTGATTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGG 2402 

Qy 2447 TGGTCCTGCC CAT CAC GC AGCAG GGCTAC CAGCAT GAGT AC GT G GAC CAGC C CAAAAT GA 2506 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I { I I I I I I I I I I I I I I I II I I 

Db 2 403 TGGTCCTGCC CAT CAC GC AGCAG GGCT AC CAGCAT GAGT AC GT G GAC CAGC C CAAAAT GA 24 62 



Qy 2507 GC GAG GT G GC C CAGAT GG C GCT GGAGGAC CAGGC C GC C ACACT GGAGT AT AAGAC CAT CA 2566 

I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 

Db 24 63 GC GAG GT GGC C CAGAT GG C GC T GGAGGAC CAGGC C GC CAC ACT GGAGT AT AAGAC CAT CA 2522 

Qy 2567 AG GAACAT CT C AGC AGCAAGAGT C C CAAC CAT GG GGT GAAC C T T GT GGAGAACCT GGACA 2 626 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 252 3 AG GAACAT CT C AGC AGCAAGAGT C C CAAC CAT GGGGT GAAC CT T GT GGAGAACCT GGACA 2582 

Qy 262 7 GCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGT 2686 

I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 258 3 GCCTGCCCCCCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGT 2 642 

Qy 2687 CTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACT 2746 

I I I I M I I I I I I I I I I I I I I I I I I I I I I II II I M I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2643 CTCAGACCGGTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACT 2702 

Qy 2747 AT AAGAGGAGCTAC C C CAC GAACT C GCT CAC GAGAAGC C AC CAGGC CAC C ACT CT CAAAA 2806 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2703 ATAAGAGGAGCTACCCCACGAACTCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAA 2762 

Qy 2807 GAAACAACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGG 28 66 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2763 GAAACAACACTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGG 2822 

Qy 2867 GAG ACAACC C GC CGC C C G CCC C GC AGAGGGT GGACT CCATC C AG GT GC ACAG CT C C CAGC 2926 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2823 GAGACAACC C GCCGCCCGCCCC GC AGAGGGT GGACT CCATC C AG GT GC AC AGCT C CCAGC 28 82 

Qy 2927 CAT CT GGCCAGGCCGT GACT GT CT CGAGGCAGCCCAGCCT CAAC GCCTACAACT CACT GA 2986 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 288 3 CATCTGGCCAGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGA 2942 

Qy 2987 CAAGGTCGGGGCTGT^AGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCT 304 6 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 294 3 CAAGGTCGGGGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCT 3002 

Qy 3047 TTGCTCCCCTTTCCACATCCATGAAGCCCAATGATGCGTGTACA 3090 

I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3003 TTGCTCCCCTTTC CACAT C CAT GAAGC C CAAT GAT G C GT GT ACA 304 6 
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Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 

Qy 61 C CAGAAGAT T C T GAGC CAAT CAGT AT TT C GCAT GGCAACTAT ACAAAAC AGT AT C C GGT G 12 0 

I I I I M I I I ! I I I M I I I I I I I I I I II I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 310 C CAGAAGAT T CT GAGC CAAT CAGT AT T T C G CAT G G C AACT AT AC AAAAC AGT AT C C GGT G 369 

Qy 121 T T T GT G GGC CACAAGCCAGGAC GGAACAC CAC ACAGAG GCAC AGG C TGGAC AT C CAGAT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 37 0 T T T GT GGG C CACAAGCCAGGAC GGAACAC CACACAGAGGCACAGGCTG GAC AT C CAGAT G 42 9 

Qy 181 AT TAT GAT CAT GAAC GGAACC CT CTACAT T GCT GCT AGG GAC CAT ATT TAT ACT GT T GAT 24 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 AT TAT GAT CAT GAAC GGAACC CT CTACAT T GCT GCTAGG GAC CAT ATT T AT ACT GT TGAT 489 

Qy 241 AT AGACAC ATC ACACACGGAAGAAAT TT ATT GTAG CAAAAAACT GACAT G GAAAT CTAGA 300 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 490 ATAGACACATCACACACGGAAGA7\ATTTATTGTAGCAAAAAACTGACATGGAAATCTAGA 549 

Qy 301 CAGGCCGAT GT AGACAC AT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 550 CAGGCCGAT GT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 609 

Qy 361 ATT AAAGT T CT T CTAAAGAAAAAC GATGAT GCATT GTT T GT CT GT G GAACTAAT GC CT T C 420 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 610 AT T AAAGTT CT T CTAAAGAAAAAC GAT GAT GCATT GTT T GT CT GT GGAACTAAT GC CT T C 669 

Qy 421 AACC CTT C C T GCAGAAACT ATAAGAT GGATAC AT T GGAAC CAT T C GGG GAT GAATT CAGC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 670 AACCCTT CCTGCAGAAACTATAAGAT GGATACATT GGAACCATTCGGGGAT GAATT CAGC 729 

Qy 481 GGAAT GGC CAGAT G C CCATAT GAT GC CAAACAT GC CAAC GT T G CACT GT T T GCAGAT GGA 54 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 30 GGAAT GGC CAGATGCCCATAT GAT GC CAAACATGC CAACGTT GCACTGTTT GCAGATGGA 789 

Qy 541 AAACTAT ACT CAGC CAC AGT GACT GACT T CCT T G C CAT T GAC GCAGT CATT T AC C G GAGT 600 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 7 90 AAACTAT ACT CAGC CACAGT GACT GACT T CCT T G C CAT T GAC GCAGT CATT T AC C GGAGT 84 9 

Qy 601 CT T G GAGAAAGC CCTAC C C T GC GGAC C GT CAAGC AC GATT CAAAAT GGT T GAAAGAACC A 660 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 850 CTT GGAGAAAGC CCT AC C CT G C GGACC GT CAAGC AC GAT T CAAAAT G GT T GAAAGAAC CA 909 



Qy 

Db 



661 
910 



720 
969 



Qy 721 GT G GAGT ATAACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT GGCT C AGGT T T GT AAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 970 GT G GAGTAT AACAC CAT GGGAAAGGT AGTT T T C C CAAGAGT GGCT CAGGT T T GT AAGAAT 1029 

Qy 7 81 GAT AT GGGAG GAT CTCAAAGAGT C C T GGAGAAAC AGT GGAC GT C GT T C CT GAAGGCGC GC 840 

I M I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I II I I I I I I I I I I I I I I 
Db 1030 GAT AT GGGAG GAT CTCAAAGAGT C CT GGAGAAAC AGT GGAC GT C GTT C CT GAAG G CGC GC 108 9 

Qy 841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1090 T T GAACT GCT CAGT T C CT G GAGACT CT CAT T T T TAT T T CAACAT T CT C CAGGCAGTTACA 114 9 

Qy 901 GAT GT GAT T C GT AT CAAC G GGCGT GAT GTT GTC C T GGCAAC GTT T T CTACACCT T ATAAC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1150 GAT GT GAT T C GT AT CAAC G G GCGT GAT GTT GT C C T GGCAAC GT T T T CTACAC CT T ATAAC 1209 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 102 0 

I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1210 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1269 

Qy 1021 GGGAGATT CAAGGAACAGAAGTCT CCT GATTCCACCT GGACAC CAGT T CCT GAT GAAC GA 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1270 GGGAGATT CAAGGAACAGAAGTCT CCT GATTCCACCT GGACAC CAGTT CCTGAT GAAC GA 132 9 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1330 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 138 9 

Qy 1141 T C CAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GC AC C C GCT C AT GGAT GAG 1200 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1390 T C CAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GC AC C C GCT CAT GGAT GAG 1449 

Qy 12 01 GC AGT GC C C T C CAT CT T CAAC AGGC CAT GGTT C CT GAGAACAAT GGT CAGATAC C GC C T T 1260 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 

Db 1450 GC AGT GC C CT C CAT CT T CAACAGGC CAT GGTT C CT GAGAACAAT GGT CAGATAC C GC C T T 1509 

Qy 12 61 AC CAAAAT T G CAGT GGACAC AGCT GCT G GGC CAT AT C AGAAT C AC ACT GTGGTTTTTCTG 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 1510 AC CAAAAT T GCAGT GGACAC AGCT GCT GGGC CAT AT C AGAAT C AC ACT GTGGTTTTTCTG 1569 

Qy 1321 GGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GGCC AGAAT AGGAAAT AGT GGT T TT CTA 1380 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1570 GGAT CAGAGAAGGGAAT CAT CTT GAAGT TT T T GGC CAGAAT AG GAAATAGT GGT T TT CTA 162 9 

Qy 1381 AAT GACAGC CT TT T CCT GGAG GAGAT GAGT GTT T ACAACT CTGAAAAAT GCAG CT AT GAT 144 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 

Db 1630 AAT GACAGC CT TT T CCT GGAG GAGAT GAGT GTT T ACAACT CT GAAAAAT GCAG CT AT GAT 1689 

Qy 14 41 GGAGT C GAAGACAAAAGGAT CAT G GGC AT GCAG CT GGACAGAGCAAG CAGCT CT CTGT AT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1690 GGAGT C GAAGACAAAAGGAT CAT GGGC AT GCAG CTGGACAGAGCAAG CAGCT CT C TGT AT 1749 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I M I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1750 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1809 

Qy 1561 T GT AAAAAAAC CT GTAT T GC C T C CAGAGAC C CAT AT T GT GGAT G GAT AAAGGAAGGT G GT 162 0 



Db 



1810 



1869 



Qy 1621 GC C T GCAG C CATTT AT CAC C C AAC AGC AGACT GACT T T T GAGCAGGACAT AGAG C GTGGC 1680 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 187 0 GC CT GCAG C CAT TT AT CAC C CAACAGC AGACT GACT T T T GAGCAGGAC ATAGAGC GT G GC 1929 

Qy 1681 AATACAGAT GGT CT GGGGGACT GT CACAATT CCTTT GT GGCACT GA 1726 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I ! I I I I I I 
Db 1930 AATACAGAT GGT CT GGG GGACT GT CACAATT C CT T T GT G GC ACT GAAT GAC ATT T CAACT 1989 

Qy 1727 ATGGGCATTCCAGTTCCCTCTTG 1749 

I I I I I I I I I I I I I I I I I I I I II I 
Db 19 90 C CT CTAC C AGAT AAT GAAAT GT CT TACAAC ACAGT GT AT GGGCAT T C C AGT TCCCTCTTG 2049 

Qy 1750 CCCAGCACAACCACATCAGATT CGACGGCTCAAGAGGGGTAT GAGT CTAGGGGAGGAAT G 18 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 2050 C CCAGCACAAC CACAT CAGAT T C GACGG CT CAAGAGGG GT AT GAGT CTAGGGGAGGAAT G 2109 

Qy 1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 1869 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2110 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 2169 

Qy 1870 T CC CAT AAT CAC CAAGACAAGAAG G GAGT GAT T C GGGAAAGT T AC CT CAAAGGC CAC GAC 1929 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II 
Db 2170 T CC CAT AAT CAC CAAGACAAGAAG GGAGT GAT TC GGGAAAGT TAC CT CAAAG GC CAC GAC 2229 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2230 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 2289 

Qy 1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 204 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2290 GT CTT CT C GGGCAT CAC CGTCTACTGCGTCTGT GAT CAT CGGCGCAAAGACGTGGCTGTG 234 9 

Qy 2050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I II II I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2350 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2409 

Qy 2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2410 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 24 69 

Qy 217 0 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 222 9 

I I I I I I II I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2470 AC GC CACT CAT GC ACAAC GG CAAGCT C G C C ACT C C C GG CAACAC G GC CAAGAT GCTC AT T 2529 

Qy 2230 TWVGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCT^ACG 228 9 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2530 AAAG C AG AC C AG CAC CAC C T G GAC C T GAC GGCCCTCCC CAC C C C AG AGT C AAC C C C AAC G 258 9 

Qy 2290 CT GCAGC AGAAGC GGAAGC C CAGC CGC GGC AGC C GC GAGT G GGAGAGGAAC CAGAAC CT C 234 9 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 
Db 2590 CT GCAGC AGAAGC G GAAGC C C AG C CG C GGC AGC CGC GAGT GGGAGAGGAAC CAGAAC CT C 2649 

Qy 2350 AT CAAT GCCT GCACAAAG GACAT G CC C C C C AT GGGC T C C C CT GT GAT T CC CAC G GAC CT G 2409 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 



Db 



2650 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 2709 



Qy 2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2469 

M I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2710 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2769 

Qy 2 4 70 GGCTACCAGCATGAGTACGT GGACCAGCCCAAAAT GAGCGAGGT GGCC CAGATGGCGCT G 252 9 

I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2770 G GC T AC C AGC AT GAGT AC GT GGAC CAGC CCAAAAT GAGCGAGGT GGCC CAGAT GGCGCT G 2829 

Qy 2530 GAGGACCAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACAT CT CAGCAGCAAGAGT 258 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 830 GAGGAC CAGGCCGCCACACTGGAGTATAAGACCAT CAAGGAACAT CT CAGCAGCAAGAGT 2889 

Qy 2590 C C CAAC C AT GGGGT GAAC CT T GT GGAGAAC CT GGAC AGCCT GC C C CC CAAAGT T C CACAG 264 9 

I I II I II II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2 8 90 C C CAAC CAT GGGGT GAAC CT T GT GGAGAAC CT GGAC AG CCT GC C C CC CAAAGTT C CACAG 294 9 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 

Qy 2710 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 2769 

I I I I I I I I II I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3010 CT GGAAAT G C AC CACT C CT CT T C CTAC GG GGTT GACT AT AAGAGGAGCTAC CC C AC GAAC 3069 

Qy 2770 T C G CT CACGAGAAGCC ACCAGGC CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 282 9 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3070 TCGCT CACGAGAAGCCACCAGGCCACCACT CT CAAAAGAAACAACACTAACTCCT CCAAT 3129 

Qy 2 830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 2889 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 3130 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 318 9 

Qy 2 890 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 294 9 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I I I M I I I II I I I I I I I I 
Db 3190 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 3249 

Qy 2 950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I M I I I I I I I I I I I I 

Db 3250 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3309 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3310 CCCTCGCTAAAGCCGGACGTACCCCCCA7VACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 

Qy 307 0 AAG C C CAAT GAT G C GT GT AC AT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I II 
Db 3370 AAGCCCAAT GAT GCGT GTACATAA 3393 
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1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I! I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I 

250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 

61 C CAGAAGAT TCT GAG C CAAT CAGTAT TT C GCAT G GCAACT ATACAAAACAGT AT C C GGT G 12 0 
I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I > M I I I I I I I I I I I I I I I 
310 C CAGAAGAT TCT GAG CCAAT C AGT ATT T C GCAT GGCAACT AT ACAAAACAGT AT C C GGT G 369 

121 T T T GT GGGC C ACAAGC C AGGAC GGAAC AC CAC ACAGAGGC ACAGGCT G GAC AT C CAGAT G 18 0 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
37 0 TTT GT GGGCCACAAGCCAGGAC GGAACACCACACAGAGGCACAGGCT GGACATCCAGAT G 42 9 

181 AT TAT GAT CAT GAAC G GAAC C CT CT AC AT T G CT G CT AGG GAC CAT AT T TAT ACT GT T GAT 24 0 

I | I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
4 30 ATT AT GAT CAT GAACGGAACCCT CTACATT GCT GCTAGGGACCATATTTATACT GTTGAT 48 9 

241 AT AGAC AC AT CAC AC AC G GAAGAAAT T TAT T GT AG C AAAAAAC T GAC AT GGAAAT C T AGA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I 
4 90 ATAGACACAT CACACAC GGAAGAAAT TT ATT GTAGCAAAAAACT GACAT GGAAAT CT AGA 54 9 

301 C AG G C C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC C ACAACT T T 360 

I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I II I I I I I 
550 CAGGC C GAT GTAGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACT T T 609 

361 ATT AAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGAAC TAAT GCCT T C 420 

I | | | | | I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I 

610 ATTAAAGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 669 

421 AAC CCTT CCT GCAGAAACT AT AAGAT GGATACATT GGAAC CATTCGGGGAT GAATTCAGC 480 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
670 AACCCTT C CTGCAGAAACTAT AAGAT GGATACATT GGAAC CATT CGGGGAT GAATTCAGC 729 

481 GGAAT GGC CAGAT G C C CAT AT GAT GC CAAAC AT GC CAAC GTT GCACT GTT T GCAGAT GGA 540 

I I I M I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I 

730 GG7WYTGGCCAGAT GCCCATAT GAT GCCAAACAT GCCAACGTT GCACT GTTT GCAGAT GGA 789 

541 AAACT AT ACT CAGC CACAGT GACT GACT T CCT T GC CAT T GAC GCAGT CAT T T AC C G GAGT 600 

I I I || I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
790 AAACT AT ACT C AG C CACAGT GACT GACT T CCT T G C CAT T GAC GCAGT CAT T T AC C GGAGT 849 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



601 CT T GGAGAAAGC C CT AC C CTG C G GAC C GT CAAGC ACGAT T CAAAAT GGTT GAAAGAAC CA 660 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

850 CT T GGAGAAAGC C C T AC C CTG C GGAC C GT CAAGC ACGAT T CAAAAT GGTT GAAAGAAC C A 909 

Qy 661 TACT T T GTT CAAGC CGT G GAT T ACGGAGAT TAT AT CT ACTT CT T CT T CAGG GAAAT AGC A 720 

I I I I I I I I I I I I I I I II I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 910 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 969 

Qy 721 GT GGAGTAT AACAC CAT G GGAAAGGT AGT T TT C C CAAGAGT G GCT C AG GTT T GTAAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I II i I I I I I I I I I I I I 

Db 970 GT GGAGTAT AACAC CAT GGGAAAGGT AGT T T T C C CAAGAGT G GCT C AGGTT T GTAAGAAT 102 9 

Qy 781 GAT AT G GGAG GAT CT CAAAGAGT CCT GGAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GC 84 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1030 GAT AT G GGAG GAT CT CAAAGAGT CCT GGAGAAAC AGT GGAC GT C GT T C CT GAAGGC GC GC 1089 

Qy 841 TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1090 T T GAAC T GCT CAGTT C CT GGAGACT C T CAT T T TT AT T T CAAC AT T CT C CAGGCAGT TACA 114 9 

Qy 901 GAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT C CT GG CAAC GT T TT CT ACAC CT TAT AAC 960 

I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1150 GAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT C C T GG CAAC GT T TT CT ACAC CT TAT AAC 12 09 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1210 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 12 69 

Qy 1021 GGGAGATT CAAGGAACAGAAGT CTCCT GATTCCAC CT GGACACCAGTTCCT GAT GAACGA 108 0 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1270 GGGAGATTCAAGGAACAGAAGT CTCCT GATTCCACCT GGACACCAGTTCCT GAT GAACGA 1329 

Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1330 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 138 9 

Qy 1141 T C C AAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAAGAC GC AC C C G CT C AT GGAT GAG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 1390 T CCAAT GAGTTCCCT GAT GATACCCT GAACTTCAT CAAGAC GCACCC GCT CATGGATGAG 1449 

Qy 1201 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I 

Db 1450 GCAGT G C C CT CCAT CT T CAAC AGGC CAT G GT T C C T GAGAACAAT GGT C AGAT AC CGCCT T 1509 

Qy 1261 AC CAAAAT T GCAGT GGACACAGCT GCT GG GC CAT AT C AGAAT CACACT GTGGTTTTTCTG 132 0 

I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1510 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1569 

Qy 1321 G GAT CAGAGAAGGGAAT CATCT T GAAGTT T T T G GC CAGAAT AGGAAAT AGT GGT T T T CT A 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1570 GGAT CAGAGAAGG GAAT CAT CT T GAAGTT T TT GGC CAGAAT AGGAAAT AGT G GT T T TCT A 162 9 

Qy 1381 AAT GAC AGC CTTT T CC T GGAG GAGAT GAGT GTT T ACAACT C T GAAAAAT GCAGCT AT GAT 14 40 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 

Db 1630 AAT GACAGC CTT T T CCT GGAG GAGAT GAGT GTT T ACAACT CT GAAAAAT GCAGCT AT GAT 1689 



Qy 

Db 



Qy 1441 GGAGT CGAAGACAAAAGGAT CAT G GG C AT GC AGCT GGACAGAGCAAGC AGCT CT CT GT AT 1500 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M > I I I 

Db 1690 GGAGT CGAAGACAAAAG GAT CAT G GGCAT GC AGC T GGACAGAGCAAGCAGCT CT CT GT AT 1749 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1750 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1809 

Qy 1561 T GTAAAAAAAC CT GT AT T GC CT C C AGAGACC CAT AT T GT GGAT GGATAAAG GAAGGTGGT 1620 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1810 T GTAAAAAAAC CT GT AT T GC CT CC AGAGACC CAT ATT GT GGAT GGAT AAAGGAAG GTGGT 1869 

Qy 1621 GC CT GCAGC CAT TT ATC AC C CAAC AGC AGACT GACT T T T GAGCAG GACAT AGAGC GT G GC 1680 

I | | I I I I I I II I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
Db 1870 G C C T GCAG C C AT TT AT CAC C CAAC AGC AGACT GACT T T T GAGCAG GACAT AGAGC GT GGC 1929 

Qy 1681 AATACAGAT GGT CT GGGGGACT GTCACAATT CCTTT GT GGC ACT GA 1726 

I I I I I I I I I I I II I I I I I I I I I ! I II I I II I I I I I I I I I I I M I I I 
Db 1930 AATACAGAT GGT CT GGG G GACT GT CACAATT C CT T T GT GGC ACT GAAT GACATT T CAACT 1989 

Qy 1727 ATGGGCATTCCAGTTCCCTCTTG 1749 

I I I I I I I I I I I I I I II I I I I I I I 
Db 1990 C CT CT AC CAGAT AAT GAAAT GT CT TACAACACAGT GT AT GGGCAT T C C AGTT CC CT CT T G 2049 

Qy 1750 C CC AGCACAAC CAC AT CAGATT C GACGGCT CAAGAGG GGT AT GAGT CT AGG GGAGGAAT G 1809 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2050 C C CAGCACAAC CACAT CAGAT T C GACGGCT CAAGAGGGGT AT GAGT CT AGGGGAGGAAT G 2109 

Qy 1810 CTGGACT GGAAGCAT CT GCT T GACT CAC CT GACAG CACAGAC CCTTT GGG GGCAGT GT CT 1869 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2110 CT G GACT GGAAGCAT CT G CT T GACT CAC C T GACAGCACAGAC C CT TT G GGGGCAGT GT CT 2169 

Qy 1870 T CC C AT AAT C AC CAAGACAAGAAG GGAGT GAT T C GGGAAAGTT AC CT CAAAGGC CAC GAC 1929 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2170 T CCCATAAT CACCAAGACAAGAAGGGAGTGATTC GGGAAAGTT ACCT CAAAGGCCACGAC 2229 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2230 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 228 9 

Qy 1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 204 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 90 GT CTT CT C GGGCAT CAC CGTCTACTGCGTCTGT GAT CATC GGC GCAAAGACGTGGCTGTG 234 9 

Qy 2 050 GT GCAGC GCAAGGAGAAG GAGCT CAC C CACT CGC G CCGGGGCTC CAT GAGCAG C GT CACC 2109 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2350 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2409 

Qy 2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I I I I I I II I II I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2410 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2469 

Qy 2170 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 222 9 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2470 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2529 

Qy 2230 AAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCT^CG 228 9 



I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I ! I I I 

Db 2530 AAAG C AG AC C AG C AC C AC C T G G AC C T G AC GGCCCTCCC C AC C C C AG AGT CAAC C C CAAC G 2 58 9 

Qy 22 90 CT GCAGC AGAAGC G GAAG CC CAGC C GC GGC AG CC GCGAGT G GGAGAG GAAC CAGAAC CT C 234 9 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I II 

Db 2590 CTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAACCAGAACCTC 2 64 9 

Qy 2350 AT CAAT G CCT GCACAAAGGACAT G C CC CCCAT GGGCTCCCCTGT GAT T CC C AC GGAC CT G 2409 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2650 AT CAAT GC CT GCACAAAG GAC AT GC CC C CCAT GGGCTCCCCTGT GAT T CC C AC GGAC CT G 2709 

Qy 2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2 469 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 2710 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2769 

Qy 2470 GGCTAC CAGCAT GAGT AC GT GGAC CAG C C CAAAAT GAGCGAGGT GGC C CAGAT GGCG CT G 252 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2770 G GCT AC CAG CAT GAGT AC GT GGAC CAGCCCAAAAT GAGCGAGGT GGC C CAGAT G GCGCT G 2829 

Qy 2530 GAGGAC C AGGC CGC CACACT GGAGT AT AAGAC CAT CAAGGAAC AT CT CAGCAGCAAGAGT 258 9 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 2 830 GAGGAC CAGGCCGCCACACT GGAGTATAAGACCAT CAAGGAACAT CT CAGCAGCAAGAGT 288 9 

Qy 2590 C C CAAC CAT GG GGT GAAC CT T GT GGAGAAC CTGGACAGCCT GC C C C C CAAAGT T C CACAG 2 64 9 

I | | | I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I 
Db 2 890 CC CAAC CAT GGGGT GAAC CT T GT G GAGAAC CT GGACAG CCT GC C C C C CAAAGT T C CACAG 2949 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2 950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 

Qy 2710 CT GGAAAT GCAC CACT C CT CTT C CT AC GGG GTT GACT ATAAGAG GAGCT AC CC CAC GAAC 2769 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M ' 
Db 3010 CT GGAAAT GCAC CACT C CT CTT C CTAC GGGGTT GACT AT AAGAGGAG CT AC CC CAC GAAC 3069 

Qy 2770 TC GCT C ACGAGAAGC CACC AGG C CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 2829 

I I M I I I I I || I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I 
Db 3070 T C GCT CAC GAGAAG C CACCAGGC CAC CACT CT CAAAAGAAACAACACT AACT C CTC CAAT 3129 

Qy 2830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 2889 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I II I I I I I 

Db 3130 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 318 9 

Qy 2890 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 2949 

I I I I I || I I I M I I I M II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3190 C AGAGGGT GGACT CCAT C CAGGT GCACAGCT C C CAGC CAT CT GG C C AGG C CGT GACT GT C 324 9 

Qy 2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I II I I I I I I I I I I I I I I I 

Db 3250 T C GAG G CAGCC CAGC CT CAAC G C CT ACAACT C ACT GACAAGGT C G G GG CT GAAGC GT ACG 3309 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I II I I 
Db 3310 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 

Qy 307 0 AAGC C CAAT GAT GC GT GT ACATAA 3093 

I I I I I I I I II I I I II I I II I I I I I 



Db 337 0 AAGC C CAAT GAT GC GT GT AC AT AA 3393 



RESULT 9 

US-10-120-988-330 

Sequence 330, Application US/10120988 
Publication No. US20030219745A1 
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APPLICANT: Tang, Y. Tom 
APPLICANT: Goodrich, Ryle 
APPLICANT: Liu, Chenghua 
APPLICANT: Ren, Feiyan 
APPLICANT: Wang, Dunrui 
APPLICANT: Drmanac, Radoje T. 
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TITLE OF INVENTION: Polypeptides 
FILE REFERENCE: 802CON 

CURRENT APPLICATION NUMBER: US/10/120, 988 
CURRENT FILING DATE: 2002-04-11 
PRIOR APPLICATION NUMBER: 09/774,528 
PRIOR FILING DATE: 2001-01-30 
NUMBER OF SEQ ID NOS : 441 
SOFTWARE: pt_FL_genes Version 2.0 
SEQ ID NO 330 
LENGTH: 42 80 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (267) . . (3410) 
US-10-120-988-330 

Query Match 98.0%; Score 3032; DB 15; Length 4280; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 3093; Conservative 0; Mismatches 0; Indels 51; Gaps 1; 

Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 267 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 326 

Qy 61 CCAGAAGATT CTGAGC CAAT CAGTATTT CGCAT GGCAACTATACAAAACAGT AT CCGGT G 120 

I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I 
Db 327 CCAGAAGATT CT GAGCCAAT CAGTATTTCGCAT GGCAACTATACAAAACAGT AT CCGGT G 38 6 

Qy 121 TTT GT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 18 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I M I I I I I I I 

Db 387 TTT GT GGGCCACAAGC CAGGAC GGAACACCACACAGAGGCACAGGCT GGACATC CAGAT G 44 6 

Qy 181 AT TAT GAT CAT GAACGGAAC CCT CT ACAT T GCT GCT AGG GAC CAT ATTT AT ACT GT T GAT 24 0 

I I I II II I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 447 ATT AT GAT CAT GAAC GGAAC CCT CT ACAT T GC T G CT AGGGACCAT AT TT AT ACT GT T GAT 506 

Qy 241 AT AGAC AC AT C ACACAC GGAAGAAAT T TAT T GT AG CAAAAAACT GAC AT GGAAAT CTAGA 300 

I I || I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 507 AT AGACAC AT C ACACAC GGAAGAAATT TAT T GT AGC AAAAAACT GAC AT G GAAAT CTAGA 566 

Qy 301 CAGGC CGATGT AGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGT GCCACAACTTT 360 







1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




UD 


567 


CAGGC CGAT GT AGAC ACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GCCACAACT TT 


626 






AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GC AT T GTT T GT CT GT GGAACTAAT G C CT T C 


420 




1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




UD 


69 7 


ATTAAAGTT CTT CTAAAGAAAAACGATGATGCATTGTTT GT CT GT GGAACTAAT GCCTT C 


686 


Qy 


421 


AACC CT T CCT GCAGAAACTATAAGAT GGAT ACAT T GGAACCAT T C G G GGAT GAAT T C AGC 


480 


DD 


DO/ 


I | I I I I I I I I 1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AACCCTT CCT GCAGAAACTATAAGAT GGAT ACAT T GGAACCAT T CGGG GAT GAAT T CAGC 


746 


Qy 


481 


GGAAT GGCCAGATGC CCATAT GAT GCCAAACATGC CAACGTT GCACT GTTT GCAGATGGA 


540 




I | | | | || | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




DD 


7 A 7 


r r a ziTrr PP AP, ATP,PPP AT ATGATGPPAAAPATGPPAACGTTGCACTGTTTGCAGATGGA 


806 


Qy 


541 


AAACT AT ACT CAG C CAC AGT GACT GACT T CCT T G C CAT T GAC GC AGT CATT T AC C GGAGT 


600 




I | I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 






07 


AAAPTATAPTPAKPPAPAGTGAPTGACTTCCTTGCCATTGACGCAGTCATTTACCGGAGT 


866 


Qy 


601 


CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCTVAAATGGTTGAAAGAACCA 


660 




1 I I I I I I 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


0 D / 


p tt r r a p a a a p,p r r T AP P PT G P P, G A P C GT C A AG C ACG AT T CAAAAT GGTT GAAAGAAC CA 


926 


Qy 


661 


TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 


720 




| | | | | I I I I 1 1 1 1 1 1 1 1 M 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 






yz / 


t 1 ArTTTTTTP A APPPPTPPATT APPrP,AGATT AT ATPT APTTCTTCTTCAGGGAAATAGCA 


986 


Qy 


721 


GTGGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAAT 


780 




I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




UD 


Q Q 7 


ptpp apt AT A APAPPATPPPAAAGGTAGTTTTCCCAAGAGTGGCTCAGGTTTGTAAGAAT 


1046 


Qy 


781 


GATATGGGAGGATCTCAAAGAGTCCTGGAGAAACAGTGGACGTCGTTCCTGAAGGCGCGC 


840 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 > 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 


i n^7 
± / 


p atatppp appatptpaaAPAPtTPPTPtPtAPtAAAPAGTGGACGTCGTTCCTGAAGGCGCGC 


1106 


Qy 


841 


TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 


900 




I | I I I 1 I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


1 1 D7 


ttp A aptpptp APrTTPPTGC^AGAPTPTP ATTTTTATTTCAACATTCTCCAGGCAGTTACA 


1166 


Qy 


901 


GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


960 




I | | | I I I I I I I I I 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 




UD 


1 1 67 


PATPTPATTP^TATPAAPGGGPGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


1226 


Qy 


961 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1020 




I I I 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




UD 


1 997 


APPATPPPTPr^TPT^PAGTPTGTGPrTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1286 


Qy 


1021 


GG GAGAT T CAAGGAACAGAAGT CT C CT GAT T C CAC CT GGACAC CAGT T C CT GAT GAACGA 


1080 




1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 




UD 


1 9ft7 


P^PxG AG AT T P A AGGAAP A GAAGT CT C CT GAT T C CAC CT GGACAC CAGTT C CT GAT GAACGA 


1346 


Qy 


1081 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1140 




1 1 1 1 1 1 1 1 I | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


1347 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1406 


Qy 


1141 


T C CAATGAGTT CCCT GAT GATACCCT GAACTT CAT CAAGACGCACCCGCT CAT GGAT GAG 


1200 




| | | | | | | || | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 





Db 1407 T C CAAT GAGTT C CCT GAT GAT AC C CT GAACT T CAT CAAGAC GCAC CC GCT C AT GGAT GAG 1466 

Qy 1201 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 1260 

I I I I I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 1 I 
Db 1467 GCAGT GCCCTCCAT CTT CAACAGGC CAT GGTT CCTGAGAACAAT GGT CAGATACC GCCTT 1526 

Qy 1261 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1320 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1527 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1586 

Qy 1321 G GAT CAGAGAAGGGAAT CAT CTT GAAGT T T T T GGC CAGAAT AGGAAAT AGT GGT T T T CT A 138 0 

I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I 
Db 1587 G GAT CAGAGAAG GGAAT CAT CTT GAAGT T T T T GGC CAGAAT AGGAAAT AGT GGT T T T CT A 1646 

Qy 1381 AAT GACAGCCTTTT CCT GGAGGAGATGAGT GTTTACAACT CT GAAAAAT GCAGCTATGAT 144 0 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1647 AAT GACAGCCT TTT C CT GGAGGAGATGAGT GTTTACAACT CT GAAAAAT GCAGCTAT GAT 1706 

Qy 1441 GGAGTCGAAGACAAAA.GGAT CAT GGGCAT GCAGCTGGACAGAGCAAGCAGCT CT CT GTAT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 17 07 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CTCT GTAT 17 66 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I | | I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I 

Db 1767 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1826 

Qy 1561 T GT AAAAAAAC CT GTAT T GC C T C C AGAGAC C CAT ATT GT GGAT G GAT AAAGGAAGGT GGT 1620 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I M I I I I I II I II I I I I I I I M I I I I I 
Db 1827 T GT AAAAAAAC CT GT ATT GC CT C C AGAGAC C CAT ATT GT GGAT GGAT AAAG GAAGGT GGT 188 6 

Qy 1621 GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 168 0 

I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I 

Db 1887 GCCT GCAG CC AT T TAT C AC C CAAC AGCAGACT GACTT T T GAGC AG GACAT AGAGC GT GGC 194 6 

Qy 1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGA 172 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 1947 AAT ACAGAT G GT CT GGGGGACT GT CACAAT TCCTTTGT GGCACT GAAT GACAT T T CAACT 2006 

Qy 1727 ATGGGCATTCCAGTTCCCTCTTG 174 9 

I I I I I I I II I I I I I I I I I I I II I 
Db 2007 CCT CT AC C AGAT AAT GAAAT GT CT T ACAAC ACAGT GTAT GGGCAT T C CAGT TC C CT CT T G 2066 

Qy 1750 C C CAGCACAAC C ACAT C AGAT T C GAC G GC T CAAGAGGGGT AT GAGT CT AGGGGAG GAAT G 18 09 

I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2067 CC CAGCACAAC CACAT CAGAT T C GAC GGCT CAAGAGG GGT AT GAGT CT AG G GGAGGAAT G 2126 

Qy 1810 CT GGACT GGAAG CAT C T GCT T GACTCAC C T GAC AGC ACAGACC CTT T GGGGGCAGT GT CT 1869 

I I I I I I I II M I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M 
Db 2127 CT GGACT GGAAG C AT CT GCT T GAC T CACCT GACAGC AC AGAC C CTT T G GG GGCAGT GT CT 2186 

Qy 1870 TCCCATAATCACCAAGACAAGAAGGGAGT GATTCGGGAAAGTTACCT CAAAGGCCAC GAC 192 9 

I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2187 TCCCATAAT CAC CAAGACAAGAAGGGAGT GATT CGGGAAAGTT ACCT CAAAGGCCAC GAC 224 6 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2247 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 2306 



Qy 


1990 


GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 


2049 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 M 
i i i i i i i i i i i i i i i i i i i i i i i i i i i • ■■ ■■■ i i > i > ■ > 1 tiii> 




Db 


2307 


GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 


2366 


Qy 


2050 


GT GC AGC GCAAGGAGAAGGAG CT CAC C C ACT CGCGCCGGGGCTC CAT GAGC AGC GT C AC C 


2109 




1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


2367 


GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 


2426 


Qy 


2110 


AAGCT CAG CGGCCTCTTT GGGGACACT CAAT C CAAAGAC CCAAAG C C G GAG GCC AT CCT C 


2169 




1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2427 


AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 


2486 


Qy 


2170 


ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 


2229 




1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 i 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | 1 I I I I I I I 1 1 1 1 1 1 l 1 i 1 1 1 1 1 1 1 I 1 1 1 1 l 1 1 1 ! 1 1 ' 1 1 1 1 • 1 1 ' 1 1 1 ' 1 1 ■ 




Db 


2487 


ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 


2546 


Qy 


2230 


AAAGCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 


2289 




i 1 1 1 1 1 M 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I i 1 1 1 1 1 1 1 II M 1 1 1 1 II 1 1 1 1 1 

| | | | | | | | | I I [ I I I I l ! 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I I ' 1 ■ 1 ' 1 1 1 1 1 1 1 1 1 1 ' 1 




Db 


2547 


AAAGCAGAC CAGC AC CAC CT GGAC CT GACGGC C C T C C C CAC C C C AGAGT CAACC C CAAC G 


2606 


Qy 


2290 


CT GCAGCAGAAGC GGAAG C C CAGC C GC GGC AGC C GCGAGT GGGAGAG GAAC CAGAAC CT C 


2349 




1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | 1 | | ] | | I I I M 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 N 1 1 1 M 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 




Db 


2607 


CT G C AGCAGAAGC G GAAGCC CAGC C G C G GC AGC C GCGAGT GG GAGAGGAAC CAGAAC CT C 


2666 


Qy 


2350 


ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 


2409 




1 1 1 1 1 1 1 M 1 1 1 ! 1 1 1 1 I If 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 
I I I I I I i i I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 1 i i i i M i i i i 




Db 


2667 


ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 


2726 


Qy 


2410 


CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 


2469 




1 1 1 1 1 1 1 i 1 1 1 1 1 I 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 l l l l l i i i i i 




Db 


2727 


CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 


2786 


Qy 


2470 


GGCT AC CAGCAT GAGT ACGT G GAC CAGCC CAAAAT GAGCGAGGT GGC C CAGAT GG C G CT G 


2529 




1 1 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

| 1 | 1 | | | | | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 > l 1 1 1 I I I I i i i i 




Db 


2787 


GGC TAC CAGCAT GAGT ACGT GGACCAGCCCAAAAT GAGC GAGGT GG C C CAGAT GGC G CT G 


2846 


Qy 


2530 


GAGGAC CAGG C CGC CACACT GGAGTATAAGAC CATCAAGGAAC ATCT CAGC AGCAAGAGT 


2589 




1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 




Db 


2847 


GAGGAC CAGG CC GC CACACT GGAGTATAAGAC CAT CAAGGAAC AT CT CAGCAGCAAGAGT 


2906 


Qy 


2590 


CC CAAC CAT GGGGT GAAC CT TGT GGAGAAC CT GGAC AGC CT G C C CC C CAAAGTT CCACAG 


2649 




1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 

| | | | | | | | | | | | | | | | 1 II 1 1 1 M 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I I I I I I I I I 1 1 1 1 1 1 1 




Db 


2907 


CC CAAC CAT GGGGT GAAC CT T GT GGAGAAC CT G GAC AGC CT GC C CC C CAAAGT T CCACAG 


2966 


Qy 


2650 


CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 


2709 




1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 
I I i i i i i i i i i i it i i i i i i i i i i i i i i i i i i i i i i i i i i ■ i i i ■ i i ■ i i ■ • ' ■ ■ * 1 ■■ 1 




Db 


2967 


CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 


3026 


Qy 


2710 


CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 


2769 




I I M 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3027 


CT G GAAAT G CAC CACT CCT CT T C CT ACGG GGT T GACT AT AAGAGGAGCT ACC C CAC GAAC 


3086 


Qy 


2770 


TCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTAACTCCTCCAAT 


2829 


Db 


3087 


I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 

T CGCT CAC GAGAAGC CAC CAGGCCAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 


3146 



Qy 2830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 28 8 9 

| | | | | | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 3147 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3206 

Qy 28 90 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 294 9 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I II I I I I I M I I 

Db 3207 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 3266 

Qy 2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I 
Db 3267 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 332 6 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3327 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 338 6 

Qy 3070 AAGC C CAAT GAT GC GT GT ACATAA 3093 

I I I I I I I II I I I I I I II I I I I I I I 
Db 3387 AAGCC C AAT GAT G C GT GT AC AT AA 3410 



RESULT 10 
US-09-957-187-84 

; Sequence 84, Application US/09957187 

; Publication No. US20030054514A1 

; GENERAL INFORMATION: 

; APPLICANT: Shimkets, Richard A. 

APPLIC7\NT: LaRochelle, William 
; TITLE OF INVENTION: NOVEL POLYNUCLEOTIDES AND PROTEINS ENCODED THEREBY 
; FILE REFERENCE: 15966-54 0 CIP 
; CURRENT APPLICATION NUMBER: US/09/957 , 187 
; CURRENT FILING DATE: 2000-09-19 
; PRIOR APPLICATION NUMBER: 60/123,667 
; PRIOR FILING DATE: 1999-03-09 
; PRIOR APPLICATION NUMBER: 09/520,781 
; PRIOR FILING DATE: 2000-03-03 
; PRIOR APPLICATION NUMBER: 60/234,082 
; PRIOR FILING DATE: 2000-09-20 
; PRIOR APPLICATION NUMBER: 60/233,798 
; PRIOR FILING DATE: 2000-09-19 

PRIOR APPLICATION NUMBER: 60/174,485 
; PRIOR FILING DATE: 2000-01-04 
; NUMBER OF SEQ ID NOS: 85 

SOFTWARE: Patentln Ver. 2.1 
; SEQ ID NO 84 

LENGTH: 4250 

TYPE: DNA 
; ORGANISM: Homo sapiens 
; FEATURE : 

NAME/ KEY: CDS 
; LOCATION: (250) (3390) 
US-09-957-187-84 

Query Match 98.0%; Score 3030.4; DB 10; Length 4250; 

Best Local Similarity 98.3%; Pred. No. 0; 

Matches 3092; Conservative 0; Mismatches 1; Indels 51; Gaps 1; 



Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 

Qy 61 CCAGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT G GCAACT AT ACAAAAC AGTAT C C GGT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 C C AGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT T GCAACT AT ACAAAAC AGTAT C C GGT G 369 

Qy 121 TT T GT GG GC CACAAGC CAGGAC GGAAC AC C ACACAGAGG C ACAGGCT GGACAT C CAGAT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I 
Db 370 TTT GTGGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGATG 42 9 

Qy 181 AT TAT GAT CAT GAAC GGAAC C CT CT AC ATT GC T GCT AGGGAC CAT AT T TAT ACT GT T GAT 24 0 

M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 430 AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T GCT G CT AGGGAC C AT AT TT AT ACT GT T GAT 48 9 

Qy 241 AT AGAC AC AT CAC ACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
Db 490 ATAGAC AC AT CAC AC AC GGAAGAAATTT AT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 54 9 

Qy 301 C AGGC C GAT GT AG ACACAT G CAGAAT GAAG GGAAAACAT AAG GAT GAGT G C C ACAACT T T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 C AGGC C GAT GT AGACACAT GCAGAAT GAAGGGAAAACAT AAGGAT GAGT GC C ACAACT T T 609 

Qy 361 ATTAAAGTTCTT CTAAAGAAAAAC GAT GAT GCATTGTTT GTCT GTGGAACTAAT GCCTT C 42 0 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I 
Db 610 AT TAAAGT T CTT CTAAAGAAAAAC GAT GAT GC ATT GT TT GT CT GT GGAACT AAT GC CTT C 669 

Qy 421 AAC C CT T C CT GC AGAAACT ATAAGAT GGAT AC AT T GGAAC CAT T C GGGGAT GAATT CAG C 48 0 

I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 670 AAC CCTT C CT GCAGAAACT AT AAGAT G GAT AC AT T GGAAC CAT T C GGGGAT GAATT CAGC 729 

Qy 481 GGAAT GGCCAGAT GCC CAT ATGATGCCAAACAT GC CAACGTT GCACT GTTTGCAGAT GGA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 30 GGAAT GGC CAGAT GCC CAT AT GAT GC CAAAC AT GC CAAC GTT GCACT GT T T GCAGAT GGA 789 

Qy 541 AAACT ATACT CAGCCACAGT GACTGACTTCCTT GCCATT GACGCAGT CATTTACCGGAGT 600 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I ! I 
Db 790 AAACT ATACT CAGCCACAGT GACT GACTT C CT T GC CAT T GAC GCAGT CAT TT AC CGGAGT 84 9 

Qy 601 CTT GGAGAAAGC C CT ACC CT GC GGAC C GT CAAGCAC GAT T CAAAAT GGT T GAAAGAACCA 660 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 850 CTT GGAGAAAG C C CT ACC CT GC G GAC CGT CAAG CAC GAT T CAAAAT GGT T GAAAGAAC CA 909 

Qy 661 T ACT T T GT T CAAG C C GT GGAT T ACGGAG AT TAT AT CT ACT T CT T CT T CAGGGAAAT AGCA 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I 
Db 910 T ACT T T GT T CAAGC C GT GGAT T ACGGAGAT TAT AT CT ACT T CT T CT T CAGGGAAAT AGCA 969 

Qy 721 GT GGAGT AT AAC AC CAT G G GAAAGGT AGT TTT C CCAAGAGT GGCT CAGGT TT GTAAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 970 GT GGAGT AT AAC AC C AT GGGAAAGGTAGT TTT C CCAAGAGT GG CT CAGGT TT GTAAGAAT 1029 

Qy 781 GAT AT G G GAGGAT C T CAAAGAGT C CT GGAGAAAC AGT GGAC GT CGT T C CT GAAGGC GC G C 84 0 

I I I I I I I I II I II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1030 GAT AT GGGAGGAT CT CAAAGAGT C CT GGAGAAAC AGT G GAC GT C GT TC C T GAAGG C GC GC 1089 



Qy 841 T T GAACT GCT CAGT T C CT G GAGACT CT C ATT T T TAT TT CAAC ATT CTC CAGG CAGT T ACA 900 



Db 


1090 


T T GAACT GCT CAGT T C CT GGAGACT C T CATT TT T AT T T CAACAT T CT C C AGGCAGT T ACA 


1149 


Qy 


901 


GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


960 




i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 

| | | | | | | I I I I I I I 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 !) 1 ■ 1 > 1 1 1 1 11 ' 




Db 


1150 


GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


1209 


Qy 


961 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1020 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I ! ! 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | | I I I I ] I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 l 1 1 1 1 ! 1 1 1 1 1 1 1 




Db 


1210 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1269 


Qy 


1021 


GGGAGATTCAAGGAACAGAAGT CTCCTGATT CCACCT GGACAC CAGTT CCT GAT GAACGA 


1080 




1 1 1 1 1 I 1 1 1 1 1 II 1 1 1 1 1 1 1 I 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 
I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ ■ ■ 




Db 


1270 


GGGAGATTCAAGGAACAGAAGT CT CCT GATT CCACCT GGACAC CAGT T C CT GAT GAACGA 


1329 


Qy 


1081 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1140 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| 1 | | | M M M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 N 1 II 1 I II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1330 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1389 


Qy 


1141 


T C CAAT GAGT T C C CT GAT GAT AC CCT GAACT T CAT CAAGACGC AC C C GCT CAT GGAT GAG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 11 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 M 1 1 1 II II 1 1 1 1 1 II II M M M 1 1 N M 1 M 1 1 1 1 1 1 1 1 1 1 M M N M l l l l l ll l 




Db 


1390 


TCCAAT GAGTTC CCTGATGATACCCT GAACTT CAT CAAGACGCACC CGCTCATGGAT GAG 


1449 


Qy 


1201 


GCAGT GCC CT C C AT CT T CAACAGGC CAT GGTT C CT GAGAACAAT GGT CAGAT AC C GC CT T 


1260 




1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 IE 

I I I I I I I I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I 




Db 


1450 


GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 


1509 


Qy 


1261 


AC CAAAAT T GC AGTGGAC ACAGCT G C T GGGC C ATAT CAGAAT CAC ACT GT GGT TTT T CT G 


1320 




I 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 E I 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 E 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 l l l l l ll I I I I I I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i ii i i i i i i i i i i 




Db 


1510 


ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 


1569 


Qy 


1321 


G GAT C AGAGAAGGGAAT C AT CT T GAAGT T T TT GGC CAGAAT AGGAAATAGTGGTTT T CT A 


1380 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 IE 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M E 1 1 1 1 1 1 1 1 1 
l l l l l l l l I I I I I i i i i i i i i i i i i i i i i ii i i i i i i i i i i i i i ii i i i i i i i i i i i i i i 




Db 


1570 


GGAT C AGAGAAGGGAAT CAT CTT GAAGT T T TT GGC CAGAAT AGGAAATAGT GGT TTT CT A 


1629 


Qy 


1381 


AAT GACAGC CT T T T C CT GGAGGAGAT GAGT GT T TAC AACT CT GAAAAAT GCAGCT AT GAT 


1440 




1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

I I I I 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 I I I I I I I I l 1 1 1 1 M 1 1 M 1 1 1 1 1 1 




Db 


1630 


AAT GACAG C CT T T T C CT G GAG GAGAT GAGT GT T TAC AACT CT GAAAAAT GCAGCT AT GAT 


1689 


Qy 


1441 


G GAGT CGAAGACAAAAG GAT CAT GGGCAT GCAGCT GGACAGAGCAAGCAGCT CTCT GTAT 


1500 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 i 1 1 1 1 1 1 M 1 1 

| | | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I! 1 1 1 1 1 1 1 1 1 1 




Db 


1690 


G GAGT C GAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGC AAGCAG CT CT CT GT AT 


1749 


Qy 


1501 


GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 


1560 




1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
l l l I I I I i I i i i i i i i i i i i i i i ii i I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 




Db 


1750 


GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 


1809 


Qy 


1561 


T GTAAAAAAAC CT GTAT T G C CT CC AGAGACC CAT AT T GT GGAT G GAT AAAGGAAGGTGGT 


1620 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i [ i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ i ■ 1 ■ ■ ■ ■ 




Db 


1810 


T GTAAAAAAAC CT GT AT T GC CT CC AGAGAC C CAT AT T GT GGAT GGAT AAAG GAAG GT GGT 


1869 


Qy 


1621 


GC CT GCAG C C AT TT AT C ACC CAAC AGC AGAC T GAC T T T T GAGCAGGAC AT AGAGC GT GGC 


1680 




I I I I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1870 


G CCT GCAGCC AT T TAT CAC C CAAC AGCAGACT GACT T T T GAG CAGGAC AT AGAGC GT GG C 


1929 


Qy 


1681 


AAT ACAGAT GGT C T GGG G GACT GT CAC AAT T C CT T T GT GGCACT GA 


1726 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 1930 AAT ACAGAT GGT CT G GG GGACT GT CACAAT T C CT T T GT GGCACT GAAT GAC ATT T CAACT 198 9 

Qy 1727 ATGGGCATTCCAGTTCCCTCTTG 174 9 

I I I I I I I I I I I II I I I I I I II I I 
Db 1990 C CT CT AC CAGATAAT GAAAT GT C T T ACAACACAGT GT AT GG GC AT T C CAGT TCCCTCTTG 204 9 

Qy 17 50 C C CAGCACAAC CACAT CAGAT T C GAC G GCT CAAGAG GGGT AT GAGT CT AGGGGAGGAAT G 18 09 

I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I II I II I I I I I I I I I I 
Db 2050 C C CAGCACAAC CACAT CAGAT T C GAC GGCT C AAGAGG G GT AT GAGT CT AGGGGAG GAAT G 2109 

Qy 1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 1869 

I | | | | | | | | M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I II I I I I I II I II I I 

Db 2110 CT GGACT GGAAGCAT CT GCT T GACTCACCT GACAGCACAGACC CTTT GGGGGCAGTGT CT 2169 

Qy 187 0 T CCCATAAT CACCAAGACAAGAAGGGAGT GATT CGGGAAAGTT ACCTCAAAGGCCACGAC 192 9 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 2170 TCCCATAAT CACCAAGACAAGAAGGGAGT GATT CGGGAAAGTTACCT CAAAGGCCACGAC 222 9 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 198 9 

I | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I II 

Db 2230 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 22 8 9 

Qy 1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2049 

I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 90 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 234 9 

Qy 2 050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I M | || | | | | I I I I I I I II I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I II 

Db 2350 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 24 09 

Qy 2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I | | | | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I M I I I I I I I I I II I I I I I I I I I 

Db 2 410 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 24 69 

Qy 2170 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 222 9 

I I || I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I 

Db 2470 AC GC CACT CAT GCACAAC GGCAAGCT CGC CACT CCC GGCAAC ACGGC CAAGAT GCT CAT T 2529 

Qy 2230 AAAGC AGAC CAG C AC CAC CT G GAC CT GAC GGC C CT C C C C ACC C CAGAGT CAAC CC C AAC G 22 89 

I | | | | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I M 
Db 2530 AAAGC AGAC CAGCAC CAC CT GGAC CT GAC GGC C CT C CC CAC C C CAGAGT CAAC C C CAAC G 2589 

Qy 2290 CT GCAGC AGAAGC G GAAGC CC AGC C GCGGCAGC CGC GAGT GG GAGAGGAAC CAGAAC CT C 2349 

I | | | M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2590 CTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAACCAGAACCTC 264 9 

Qy 2350 AT CAAT G C CT GCACAAAGGAC AT GC C C C CCAT GGGCTCCCCT GT GATT C C CAC GGACCT G 24 09 

I | | | | M II I I I I I I I I I I I I I I I I M I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I 

Db 2650 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 2709 

Qy 2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2710 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2769 

Qy 2470 G GCT ACC AGCAT GAGT AC GT G GAC CAG C C CAAAAT GAG C GAG GT GGC C CAGAT GGC GCT G 2529 

I | | | | | M I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I II I I I I I I M I I I I M I I I I 
Db 2770 GGCTAC C AGCAT GAGT AC GT GGAC CAG C CCAAAAT GAGC GAGGT G GC C CAGATGGC GCT G 2 829 



Qy 

Db 



2530 
2830 



2589 
2889 



Qy 2 590 CC CAAC CAT GGGGT GAAC CT T GT GGAGAAC CT GGACAGC CT GC C CC C C AAAGT T CC ACAG 264 9 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2890 CC CAAC CAT GGGGT GAAC CT T GT GGAGAAC CT G GACAGC CT G C C CC C CAAAGT T CC ACAG 2949 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2 950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 

Qy 2710 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 27 69 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3010 CT GGAAAT GCAC C ACT C CT C TT C CT AC GGGGT T GACT AT AAGAGGAGCT AC C C CAC GAAC 3069 

Qy 2770 T C GCT CAC GAGAAGC CACC AGGC CAC CACT CT CAAAAGAAACAACACT AACT C CT C CAAT 2829 

I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 

Db 3070 T C G CT CAC GAGAAGC CACC AGGC CAC CACT CT CAAAAGAAACAACACT AACT C CTC CAAT 3129 

Qy 2 830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 28 8 9 

M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I II I II I I 

Db 3130 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3189 

Qy 2890 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 2949 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I 

Db 3190 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 3249 

Qy 2 950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3250 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3309 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3310 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 

Qy 3070 AAGC C CAAT GAT GCGT GT ACAT AA 3093 

I I I I I I I I I I II I I I I II I I I I I I 

Db 3370 AAGC C CAAT GAT GC GT GT AC AT AA 3393 



RESULT 11 
US-10-403-676-13 

Sequence 13, Application US/10403676 
Publication No. US20040029150A1 
GENERAL INFORMATION: 
APPLICANT: Alsobrook II, John 
APPLICANT: Anderson, David W. 
APPLICANT: Boldog, Ferenc L. 
APPLICANT: Burgess, Catherine E. 
APPLICANT: Casman, Stacie J. 
APPLICANT: Edinger, Shlomit R. 
APPLICANT: Gerlach, Valerie L. 
APPLICANT: Grosse, William M. 
APPLICANT: Guo, Xiaojia 
APPLICANT: Gusev, Vladimir Y. 
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APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Ji, Weizhen 
LaRochelle, William J. 
Lepley, Denise M. 
Li, Li 

Liu, Xiaohong 
MacDougall, John R. 
Malyankar, Uriel M. 
Millet, Isabelle 
Padigaru, Muralidhara 
Patturajan, Meera 
Peyman, John A. 
Rastelli, Luca 
Reiger, Daniel 
Rothenberg, Mark E. 
Shimkets, Richard A. 
Stone, David J. 
Taupier, Raymond J. 
Vernet, Corine 
Zerhusen, Bryan D. 

THERAPEUTIC POLYPEPTIDES, NUCLEIC ACIDS ENCODING SAME, 



APPLICANT 
TITLE OF INVENTION 
AND METHODS OF USE 

FILE REFERENCE: 21402-573B 

CURRENT APPLICATION NUMBER: US/10/403,676 
CURRENT FILING DATE: 2003-03-31 
PRIOR APPLICATION NUMBER: 60/123,667 
PRIOR FILING DATE: 1999-03-09 
PRIOR APPLICATION NUMBER: 09/520,781 
PRIOR FILING DATE: 2000-03-08 
PRIOR APPLICATION NUMBER: 09/957,187 
PRIOR FILING DATE: 2001-09-19 
PRIOR APPLICATION NUMBER: 60/371,002 
PRIOR FILING DATE: 2002-04-09 
PRIOR APPLICATION NUMBER: 60/127,352 
PRIOR FILING DATE: 1999-04-01 
PRIOR APPLICATION NUMBER: 09/538,092 
PRIOR FILING DATE: 2000-03-29 
PRIOR APPLICATION NUMBER: 09/604,286 
PRIOR FILING DATE: 2000-06-22 
PRIOR APPLICATION NUMBER: 60/140,584 
PRIOR FILING DATE: 1999-06-23 
PRIOR APPLICATION NUMBER: 60/370,381 
PRIOR FILING DATE: 2002-04-05 
PRIOR APPLICATION NUMBER: 60/384,297 
PRIOR FILING DATE: 2002-05-30 
Remaining Prior Application data removed 
NUMBER OF SEQ ID NOS : 179 
SOFTWARE: CuraSeqList version 0.1 
SEQ ID NO 13 
LENGTH: 4250 
TYPE : DNA 

ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (250) . . (3390) 
US-10-403-676-13 



See File Wrapper or PALM. 



Query Match 



98.0%; Score 3030.4; DB 12; Length 4250; 



Best Local Similarity 98.3%; Pred. No. 0; 

Matches 3092; Conservative 0; Mismatches 1; Indels 51; Gaps 1; 

1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 

61 CC AGAAGAT T CT GAGC CAAT CAGT AT T T C G CAT GGCAACT AT ACAAAACAGTAT CC GGT G 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I II I 
310 CCAGAAGAT T CT GAGC CAAT CAGT AT T T C GCAT T GCAAC TAT ACAAAACAGTAT CC G GT G 369 

121 TT T GT G G GC C ACAAGC CAGGAC G GAACAC C AC AC AGAGGC AC AGGCT GGACAT CCAGAT G 180 

I | | | | | | II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

370 TTT GTGGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT CCAGAT G 42 9 

181 ATTAT GATCATGAACGGAACCCT CTACATT GCT GCTAGGGAC CATATTTATACT GTT GAT 240 

I | | | | | || | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
430 AT TAT GAT CAT GAAC GGAAC CCT CT ACAT T GC T GCTAGGGAC CAT AT T TAT ACT GT T GAT 48 9 

241 AT AGACAC AT CACACAC GGAAGAAAT T TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 300 

I | | ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I II I I I I I I I I I I I I 
490 AT AGACAC AT CACACAC GGAAGAAATT TAT T GT AGCAAAAAACT GACAT GGAAAT CT AGA 549 

301 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGATGAGTGCCACAACTTT 360 

I | | | | | | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I 

550 CAGGCCGAT GTAGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGT GCCACAACTTT 609 

361 ATTAAAGTT CTT CTAAAGAAAAACGAT GAT GCATT GTTT GTCT GT GGAACTAAT GCCTT C 42 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
610 ATTAAAGTTCTTCTAAAGAAAAACGATGATGCATTGTTTGTCTGTGGAACTAATGCCTTC 669 

421 AACC CT T C CT G C AGAAACT AT AAGAT GGAT AC ATT GGAAC CAT T C GG GGAT GAAT T C AGC 480 

II | | | | | M I I I I I I I I M I I I I I M I I I I I I II I I I I I I I M I I I M I II I I I I I I I I I 
670 AAC C CT T C CT GC AGAAACT AT AAGAT GGAT AC ATT GGAAC C AT TC GGG GAT GAAT T CAGC 72 9 

481 GGAAT GGC CAGAT GC C CAT AT GAT GC CAAAC AT GC CAAC GTT GCACT GTT T GCAGAT GGA 54 0 

I I I I M II I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
730 GGAAT GGC CAGAT GC C CAT AT GAT G C C AAACAT G CCAAC GT T GCACT GT T T GCAGAT G GA 789 

541 AAACT ATACT C AGC CAC AGT GACT GACT T CCT T GC CAT T GAC GC AGT C AT TT ACC GGAGT 600 

I | | | II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
790 AAACT AT ACT CAGC CAC AGTGACT GACT T CCT T GC CATT GAC G CAGT CAT TT ACC G GAGT 84 9 

601 CT T GGAGAAAGC C CTAC C CT GC GGACC GT CAAGC AC GATT CAAAAT GGTT GAAAGAAC C A 660 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
850 CT TGGAGAAAGC CCT AC C CT G C GGAC C GT CAAGCAC GAT T CAAAAT GGT T GAAAGAAC CA 909 

661 TACT T T GT T CAAGC C GT GGAT T AC G GAGATT AT AT CT ACTT CT T CT T CAGGGAAATAG CA 720 

I | | | | II I I I I I I I I I I I I II I I I I I I I I II M I I I I I I I II I I I I I I I I I I I I I I I I I I 

910 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 969 

721 GT GGAGT AT AACAC CAT GGGAAAGGT AGT T T T CC CAAGAGT GGCT CAGGTT T GT AAGAAT 7 80 

I | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I 
970 GT GGAGT AT AAC AC CAT GGGAAAGGT AGT T T T CC CAAGAGT GGCT C AG GTT T GT AAGAAT 1029 

7 81 GATAT GGGAGGAT CT CAAAGAGT C CT G GAGAAAC AGT GGAC GTCGTTCCTGAAGGCGCGC 8 40 
| M I I I I M I M I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 



1030 GAT AT GGGAG GAT CT C AAAG AGT C CT G GAGAAAC AGT G GAC GT CGT T C CT GAAGG C GC GC 108 9 

841 T T GAACT GCT CAGT T C CT G GAGACT CT CAT TTT T AT T T CAACAT T C T C C AGGCAGT T ACA 900 
| | | | | | | I I I I I I I I II I I I II I M I I M M I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
1090 T T GAACT GCT CAGT T C CT GGAGACT CT CAT T TT T AT TT CAACAT T CT C C AG GCAGT T ACA 1149 

901 GAT GT GAT T C GT AT CAACGGGC GT GAT GT T GT C CT GGCAAC GT T TT CT AC ACCT TAT AAC 960 
| | | | | I I I II I I I I I I I I I I I I I M I I II I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 
1150 GAT GT GAT T C GT AT CAACGGGC GT GAT GT T GT C CT GGCAAC GT T TT CT AC AC CT T AT AAC 1209 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

M | | | | | | | | | | || I M II II I M I I I I I I I I I I I I I I I II M I I I II I I I I I 

1210 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 12 69 

1021 G GGAGAT T CAAG GAACAGAAGT CTC CT GAT T C C AC CT GGACAC CAGT T C CT GAT GAACGA 1080 

| | | | | | I II I I I I I I I II I I II I I I I I II I I I I M II M I I I I I I II I I I 

1270 G GGAGATT CAAG GAACAGAAGT CTC CT GAT T C CAC CT GGACAC CAGT T C CT GAT GAACGA 1329 

1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

| | | | | M | | | | || | | I | I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I 

1330 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 13 89 

1141 T CCAAT GAGTT CCCT GAT GATACCCTGAACTT CAT CAAGACGCACCCGCTCATGGAT GAG 12 00 

| | | | | | | | | | | | | II I I I I I II I I I I I I I II II I I I I I I I I M I I I I I I I I I I I I I I I II 
1390 T CCAAT GAGTT CCCT GAT GATACCCT GAACTT CATCAAGACGCACCCGCT CATGGATGAG 14 49 

1201 G CAGT GC C CT C CAT CT T CAAC AGGC CAT G GTT C CT GAGAACAAT GGT C AGAT ACC GCCT T 12 60 

| | | I I I I I I I I I M I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I 

1450 G CAGT GC C CT C CAT CT T CAAC AGGC CAT G GTT CCT GAGAACAAT GGT C AGAT AC C GCCT T 1509 
1261 AC CAAAAT T GCAGT G GAC AC AGCT GCT GG GC CAT AT C AGAAT CAC ACT GTGGTTTTTCTG 1320 

M | I M I M I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1510 AC CAAAAT T GCAGT G GAC AC AGCT GCT G GGC CAT AT CAGAAT CAC ACT GT GGT T TTT CT G 1569 

1321 G GAT CAGAGAAGGGAAT CAT CT T GAAGT TTT T GGC CAGAAT AGGAAAT AGT G GT T T T CT A 138 0 

| M I I I I M I I I I II I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I M I I I I I 
1570 GGAT CAGAGAAGGGAAT CAT CTT GAAGTTTTT GGCCAGAAT AGGAAAT AGT GGTTTT CTA 162 9 

1381 AAT GAC AGC CT T T T CCT G GAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GCAGCT AT GAT 144 0 

| | | | | | | | | | | | I I I I I I I I I I I I II I I I I I I I I M M I II I I I I I I M I I I I M I I I I I 
1630 AAT GAC AGC CT TT T C CT G GAGGAGAT GAGT GT T T ACAACT CT GAAAAAT GCAGCT AT GAT 168 9 

1441 GGAGTCGAAGACAAAAGGAT CAT GGGCAT GCAGCT GGACAGAGCAAGC AGCT CT CT GT AT 1500 

| | M | | | | I I M I I I I I I I I I I I I I I I I I M I I M II I I II I I I I I I M I I I I I II I I I I 
1690 GGAGT C GAAGACAAAAG GAT CAT GGG CAT GCAGCT GGACAGAG CAAGCAGCT CT CT GT AT 17 4 9 

1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 15 60 

| | | M I I I I I I I I I I M I I I I I I I I I I I I M I I M M I I I I I I I I M I I I I I I M I I I I I 

1750 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 18 09 

1561 T GT AAAAAAACCT GT AT T GC CT C CAGAGAC C CAT AT T GT G GAT GGAT AAAG GAAGGT GGT 162 0 

| | | | | | | | | I || I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I M M I I II I I I I I I I I 
1810 T GT AAAAAAACCT GTATTGCCT CCAGAGACCCATATT GT GGAT GGATAAAGGAAGGT GGT 1869 

1621 GC CT G C AGC CAT T TAT CAC C C AACAG CAGACT GACT T TT GAG CAGGACAT AGAGCGT GGC 1680 

|| | | | I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I M I I II I I I I I M I I I I I I I I I 
187 0 GC CT GCAGC CAT T TAT CAC C CAACAGCAGACT GACT T TT GAGC AGGACAT AGAGC GT GGC 1929 



Qy 


1681 


Db 


1930 


Qy 


1727 


Db 


1990 


Qy 


1750 


Db 


2050 


Qy 


1810 


Db 


2110 


Qy 


1870 


Db 


2170 


Qy 


1930 


Db 


2230 


Qy 


1990 


Db 


2290 


Qy 


2050 


Db 


2350 


Qy 


2110 


Db 


2410 


Qy 


2170 


Db 


2470 


Qy 


2230 


Db 


2530 


Qy 


2290 


Db 


2590 


Qy 


2350 


Db 


2650 


Qy 


2410 


Db 


2710 



AAT ACAGATGGT CT GGGGGACT GT CACAATT CCTTT GT GGCACT GA 1726 

I M I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

AAT ACAGAT GGT CT G GGGGACT GT CACAATT C CT T T GT G GC ACT GAAT GAC AT T T CAACT 1989 

ATGGGCATTCCAGTTCCCTCTTG 1749 

I I I I I I I I I I I I I I I I I I I I II I 
C C T CTAC CAGAT AAT GAAAT GT CT T ACAACACAGT GT AT GG GCAT T C CAGT TCCCTCTTG 2049 

C C CAG C AC AAC CAC ATC AGAT T CGAC G G CT CAAGAGGGGT AT GAGT CT AGGGGAG GAAT G 1809 

| I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

C C CAGCACAAC CAC AT CAGAT T C GAC GGCT CAAGAG GGGTAT GAGT CT AGGGGAGGAAT G 2109 

CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 1869 

I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 2169 

T CC C AT AAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT T AC CT CAAAG GC CAC GAC 1929 
M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I II I 
T C C CAT AAT CAC CAAGACAAGAAGG GAGT GAT T C G GGAAAGTTAC CT CAAAGGC CAC GAC 2229 

CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I | | | | | | I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I ! I I I I I I I I I I M I I 

CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 228 9 

GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 204 9 

I || | | I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I I I M I I I I I I I I I I I I I 

GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 234 9 

GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I II II I M I I I I I I 

GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2409 

AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 

AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 24 69 

AC GC C ACT CAT G C ACAAC G G CAAGCT CGC C ACT C CC GG CAACAC GGC CAAGAT GCT C ATT 222 9 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I II I M I I I I I II II I I I I I I I 

ACG C CACT CAT GC ACAAC GGCAAGCT C GC C ACT C CC GGCAACAC GG C CAAGAT GCT C ATT 2529 

AAAG CAG AC CAG CAC CAC C T G GAC C T GAC GGCCCTCCC CAC C C C AG AGT C AAC C C C AAC G 22 8 9 
I | | M | | | | | I I I I I I II I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGC AGAC CAG CAC C ACCT GGACCT GAC GG C C CT C C C C AC CC CAGAGT CAAC C CCAAC G 2589 

CT GCAGCAGAAGC GGAAGC C CAGC C G C GGCAGC C GC GAGT G G GAGAGGAAC CAGAAC CT C 234 9 

I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT GCAGCAGAAG C GGAAGC C CAG C C G C GG CAGC C G C GAGT GGGAGAGGAAC C AGAAC CT C 264 9 

AT CAAT GCCT GC ACAAAGGACAT GC C C CC CAT GGGCTCCCCTGT GAT T C C CAC G GAC CT G 24 09 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

AT CAAT GCCT GC ACAAAG GACAT GC C C CC CAT GGGCT CC C CT GT GAT T C C CAC GGAC CT G 27 09 

CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

| | M | I I I I I I I I I I II I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 27 69 



Qy 

Db 



2470 
2770 



2529 
2829 



Qy 2530 GAGGACC AGGC C GC C ACACT G GAGTAT AAGAC CAT CAAG GAAC AT CTCAGC AGCAAGAGT 2589 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2830 GAG GACC AGG CC GC C AC ACT GGAGT ATAAGAC CAT CAAG GAAC AT CT CAGC AG CAAGAGT 2 8 89 

Qy 2590 C C C AAC C AT GGG GT GAAC CTT GT GGAGAACCT GGACAGC CT G C C C C C CAAAGT T C C ACAG 2649 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2890 C C CAAC CAT GGG GT GAAC CTT GT G GAGAAC CT GGACAG CCTGCCCCC CAAAGT T C CAC AG 2949 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 

Qy 2710 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 2769 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3010 C T GGAAAT GCAC CACT C C T CT T C CT AC GGG GT TGACT AT AAGAGGAG CT AC C CCAC GAAC 3069 

Qy 277 0 T CGCT CACGAGAAGCCACCAGGCCACCACTCT CAAAAGAAACAACACTAACT CCT CCAAT 2 829 

I I I II I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I i I I I I I I I I I I M I I I I I M I I I 

Db 3070 T CGCT CACGAGAAGCCACCAGGCCACCACTCT CAAAAGAAACAACACTAACT CCT CCAAT 3129 

Qy 2830 T CCT CT C ACCT CT C CAGAAAC CAGAGCT T T G G CAGGGGAGACAAC CCGCCGCCCGCCCCG 2889 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 3130 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3189 

Qy 2890 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 294 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 3190 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 324 9 

Qy 2 950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3250 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3309 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3310 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 

Qy 307 0 AAGC C C AAT GAT G C GT GT AC AT AA 3093 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3370 AAGC C CAAT GAT GC GT GT ACATAA 3393 
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Qy 1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 




Db 



250 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 309 



Qy 



Db 



61 C CAGAAGAT T CT GAGCCAAT C AGT AT TT C GC AT GGCAACT AT ACAAAACAGT AT C C GGT G 12 0 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 

310 C CAGAAGAT T CT GAGCCAAT CAGT AT TT C GC ATT GCAACTAT ACAAAACAGT AT C C GGT G 369 



Qy 



121 TTTGT GGGC CACAAGCCAGGACGGAACACCACACAGAGGCACAGGCTGGACAT CCAGAT G 180 




Db 



370 T T T GT GGGC CACAAGCCAG GAC GGAACAC CACACAGAGGCACAGGCT GGAC AT C C AGAT G 429 



Qy 



181 



AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T G CT GCT AGG GAC CAT ATTT AT AC T GT T GAT 240 
I I I I I I I I I I I I I II I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 



Db 



430 AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T G CT G CT AGGGAC CAT ATT TAT AC T GT T GAT 4 89 



Qy 241 ATAGACACATCACACACGGAAGAAATTT ATT GTAGCAAAAAACT GACAT GGAAAT CTAGA 300 

I | | | i | | M I I I I I I I I I I I I I Ml I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 4 90 ATAGACACAT CACACAC GGAAGAAAT TT AT T GTAGCAAAAAACT GACAT GGAAAT CTAGA 54 9 

Qy 301 C AG GC CGAT GT AGACAC AT G CAGAAT GAAGGGAAAACATAAGGAT GAGT GC CACAACT T T 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I 
Db 550 C AGGC CGAT GT AGACAC AT GC AGAAT GAAGG GAAAAC AT AAGGAT GAGT GC CACAACT T T 609 

Qy 361 AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GT TT GT CT GT GGAACT AAT G C CT T C 420 

I | I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 610 AT T AAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GT T TGT CTGT GGAACTAAT GC CT T C 669 

Qy 421 AACC CTT CCT GCAGAAACTATAAGATGGAT ACATTGGAACCATTC GGGGAT GAATTCAGC 4 80 

I I I I M I I I I I I I M I I I I I II I II I I I I I i I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 670 AAC C CTT C CT G CAGAAACT AT AAGAT GGAT ACAT T GGAAC CATT C GG GGAT GAAT T C AGC 72 9 

Qy 4 81 G GAAT G G C C AG AT G C C CAT AT GAT G C C AAAC AT G C C AAC GT T G C AC T GT T T G C AG AT G G A 540 

I I I I I I I I I I I II I I M I I II I I II I I I I I I I I I II I II I I I I I I I I I I I I I I I I M I I I 
Db 730 GGAATGGC CAGAT GCCCATATGAT GCCAAACAT GCCAACGTT GCACT GT TT GCAGAT GGA 7 89 

Qy 541 AAACTAT ACT CAGC CAC AGT GAC T GACT T C C T T G C C AT TGAC GC AGT CAT TT AC C GGAGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 7 90 AAACTAT ACT CAGC CAC AGT GACT GACT T C CTT GCCATT GAC GC AGT CAT T T AC C GGAGT 849 

Qy 601 CTT GGAGAAAGCC CT AC C CT GCG GAC C GT CAAGC AC GATT CAAAATG GT T GAAAGAAC CA 660 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 850 CTT GGAGAAAGCC CT AC CCT GCGGAC C GT CAAGC AC GATT CAAAAT GGT T GAAAGAAC CA 909 

Qy 661 T ACT TT GT T CAAGC CGT GGAT T AC GGAGAT T AT AT CT ACT T CT T CTT CAG GGAAAT AG CA 720 

I | | | I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 910 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 969 

Qy 721 GT GGAGT AT AACAC CAT GGGAAAGGT AGT T T T C C CAAGAGT GGCT CAG GT T T GTAAGAAT 780 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 970 GT GGAGT AT AACAC CAT GGGAAAGGT AGT T T T C C CAAGAGT GG CT CAGGT T TGT AAGAAT 1029 

Qy 781 GAT AT GGGAGGAT C T CAAAGAGT C CT GGAGAAACAGT GGAC GT C GT T C CT GAAGGC G C GC 840 

I I I I I I I I I I I I I I I I II I I M M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1030 GAT AT G GGAGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT C GTT C CT GAAGGC GC GC 1089 

Qy 841 TT GAACT GCT CAGT T C C T GGAGACT CT CAT T T T TAT T TCAAC AT T CT C CAGGC AGT T ACA 900 

I | | I I I I I I I I I I M I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 1090 TT GAACT G CT CAGT T C CT GGAGACT CT C ATT T T TAT T T CAAC ATT CT C CAGGC AGT T AC A 1149 

Qy 901 GAT GT GATT C GT AT CAACGGGC GT GAT GT T GT C C T GG CAAC GT T TT C TAC ACCTTAT AAC 960 

I | | | | | I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I II II I I I II I I I I I 
Db 1150 GAT GT GAT T C GTAT CAACGGGC GT GAT GT T GT C CT GGCAAC GTT TT CT AC AC C T TAT AAC 1209 

Qy 961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I I || I || I I I I M II I II I M II I I II II II I I I I II I I I I I I II I M II II I II II I II 

Db 1210 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1269 

Qy 1021 G GGAGATT C AAGGAACAGAAGT C T C CT GAT T C CAC C T G GACAC CAGT T C CT GAT GAAC GA 108 0 

| | | | | | || | M I I I II II I I I I I I I II I I II M II I I II I II I I II I II I I I I M M I II 
Db 127 0 GG GAGATT CAAGGAACAGAAGT CT C CT GAT T C CAC CT GGACAC CAGT T C CT GAT GAAC G A 132 9 



1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 114 0 

| I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I 
1330 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1389 

1141 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC GC ACC C GCT CAT GGAT GAG 12 00 

| | | | | | | | M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I 1 I I I I 
1390 T C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT CAAGAC GC AC C C GCT CAT GGAT GAG 1449 

1201 GC AGT G C C C T CCAT CT T CAAC AGGC C AT G GTT C CT GAGAACAAT GGT CAGAT AC CGC CTT 12 60 

| | | I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I 

1450 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 1509 

1261 AC CAAAAT T G CAGT GGAC AC AG CT G CT G GGCCAT AT CAGAAT CAC ACT GT GGTTTTTCTG 132 0 

| M I I I II II I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I II I Ml 

1510 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1569 

1321 GGAT CAGAGAAGGGAATCAT CTT GAAGTTTTT GGCCAGAATAGGAAATAGTGGTTTTCT A 1380 

| | | | | | M | M I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I II I I I 

157 0 GGAT C AGAGAAGGGAAT CAT CTT GAAGT T T TT GGC CAGAATAGGAAAT AGT GGT T TT CT A 1629 

1381 AAT GACAGC CTT T T C CT G GAGGAGAT GAGT GT T T ACAACT CT GAAAAAT G CAGCT AT GAT 144 0 

| | | | I I I I I I M I I I I I I I I I I I M I II I M I I I I M I I I I I I I I I I I I I I I I I I I I I M 
1630 AAT GACAGC CT T T T C CT G GAGGAGAT GAGTGT T T ACAACT CT GAAAAAT G CAGCT AT GAT 1689 

1441 G GAGT C GAAGACAAAAGGAT CAT G GGC AT GC AGCT GGACAGAGCAAGC AGCT CT CT GT AT 1500 

| | M I I MINI M II I I I I I M I I I I I I I I I I I I I I I I I I 

1690 GGAGT CGAAGACAAAAGGAT CAT GGGCAT GC AGCT GGACAGAGCAAGC AGCT CT CT GT AT 1749 

1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

| | | I M I M I I II I I I I I I I M I I I I M I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
1750 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 18 09 

1561 T GT AAAAAAAC CT GT AT T GC CT CCAGAG AC C CAT AT T GT GGAT GGAT AAAG GAAGGT GGT 1620 

M | | | | | | | | | M I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I M I I M I I 
1810 T GT AAAAAAAC CT GT ATT GC CT C CAGAGAC C CAT ATT GT G GAT GGATAAAGGAAGGTGGT 1869 

1621 GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 1680 

| | | | | | | | | II I I I I I I II I I I I I I I I I I I I M I M II I I I I I I M I I I I M I I I I I I I I 

1870 GCCT G C AGCCAT T TAT CAC C CAAC AGC AGACT GACTT T T GAGCAG GACAT AGAG C GT G GC 1929 

1681 AAT ACAGAT GGT C T GGGGGACT GT CACAAT T CCT T T GT GGC ACT GA 172 6 

I I I I I I I II M I I I I I I M I I II I I I I I I M I I I I I I I I I I I M I I 
1930 AAT ACAGAT GGT C T GGGGGACT GT CACAAT T CCT T T GT GGCACT GAAT GACATT T CAACT 198 9 

172 7 ATGGGCATTCCAGTTCCCTCTTG 174 9 

I I I I I I I I I I I I I I I I I I M I I I 
1990 CCT CT AC CAGAT AAT GAAAT GT CT TACAACACAGT GT ATGG GC AT T C CAGT TCCCTCTTG 2049 

1750 CCCAGCACAACCACAT CAGATT CGACGGCT CAAGAGGGGTATGAGT CTAGGGGAGGAAT G 1809 

M | I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I M I I I 
2050 CCCAGCACAACCACAT CAGATT CGACGGCT CAAGAGGGGTATGAGT CTAGGGGAGGAAT G 2109 

1810 CT GGACT GGAAGCAT CT GCT T GACT CAC CT GACAGCACAGACCCTTT GGGGGCAGT GT CT 18 69 

| | || I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I M M II I I I I I I I I 

2110 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 2169 



1870 T C C CAT AAT CAC CAAGACAAGAAGGGAGT GAT T C G GGAAAGT T ACCT CAAAG GC CAC GAC 192 9 

| I I I I I I I M I I I I I II I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I 

2170 T C C CAT AAT CAC CAAGACAAGAAGGGAGT GAT T C GGGAAAGTT ACCT CAAAGGC CAC GAC 222 9 

1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 198 9 

| | | | I I I I I M I I I I I I I I I I I M I I II I I I I II I I I I I I I I I I M I I I I I I I I II I I I I 
2230 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 22 8 9 

1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGC7VAAGACGTGGCTGTG 204 9 

| M I II I I I I I I I I I I I I I I I I II II I II I I II I I I I I I I I II I I I I I I I I I I I I I I I I I 
2290 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 234 9 

2 050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

| I I I I I I M I I I I II M I I M I I I I I I I I I I I I M I M I I I I I I I I I I M I I I I I I I I II 

2350 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 24 09 
2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I M I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

2410 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCT^AGCCGGAGGCCATCCTC 24 69 
217 0 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2229 

I I I I M I I I I I I I M II II I I I I I II I M I I I I I I I I M I I I I I I I I I I I I I I 

2470 AC GC CACT CAT G CACAAC GGCAAGCT CG C CAC T CC CGGCAACACG GCCAAGAT GCT CATT 2529 
2230 7W^GCAGACCAGCACCACCTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 22 89 

I I I M I I I I II I I I II I M I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

2530 AAAGCAGACCAGC AC CAC CT G GACCT GAC GGCCCTCCC CAC C C CAGAGT CAAC C C CAAC G 2589 

22 90 CT GCAGC AGAAGCGGAAG C C C AGC C G C GGCAGCC G C GAGT GGGAGAG GAAC CAGAACC T C 2349 

| I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
259 0 CTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAACCAGAACCTC 2649 

2350 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 24 09 

| | | M | I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I M M I I I I I I I 
2650 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 2709 

2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I 

2710 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2769 

2470 GG CTAC CAGCAT GAGT AC GT G GAC CAG C CCAAAAT GAGCGAGGT G GC C CAGAT GGCGCT G 2529 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

277 0 GGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTG 282 9 

2530 GAGGAC CAGGC C GC CACACT G GAGT ATAAGAC CAT CAAGGAAC AT CT CAGCAGCAAGAGT 2589 

I || | | | || I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M M I I I I I 
2 830 GAGGAC CAGGC CGC CACACT GGAGT ATAAGAC CAT CAAG GAAC AT CT CAG CAGC AAGAGT 288 9 

2590 CC CAAC CAT G GGGT GAACC TT GT GGAGAAC CT GGACAGCCT GC C CC C CAAAGT T C CAC AG 2649 

I | || | || | I I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I M I I I I M I I I I I I I I I 
2890 CC CAAC CAT G GGGT GAACCT T GT GGAGAAC CT G GAC AGC CT GC C CC C CAAAGT T CCACAG 294 9 

2 650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I I M I I I I I I I I I I I M I I I I I I I I I M II I I I I I I I I I M I II I I I II I I I I I I I I I I 

2950 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 3009 
2710 CTGGAAATGCAC CACT CCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCAC GAAC 27 69 



Db 


3010 


Qy 


2770 


Db 


3070 


Qy 


2830 


Db 


3130 


Qy 


2890 


Db 


3190 


Qy 


2950 


Db 


3250 


Qy 


3010 


Db 


3310 


Qy 


3070 


Db 


3370 



| | | | M I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I 

CT GGAAAT GCACCACT CCT CT T CCTACGGGGTT GACTATAAGAGGAGCTACCCCAC GAAC 3069 
T C GC T CAC GAGAAGC CAC CAGGCC AC C ACT CT CAAAAGAAACAAC ACT AACT C CT C CAAT 2829 

| | | M | I I I I I I M I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I II I I I I I I I I I I M 

T C GCT CAC GAGAAGC CAC CAGGCC AC C ACT CT CAAAAGAAACAAC ACT AACT C CT C CAAT 3129 

TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 2 889 

| | | | I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I II I 

TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 3189 

CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 294 9 
| | | | | M | | I I I I I I M I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAGGGT GGACT C CAT C CAG GT G CACAGCT C C C AGC CAT CT GG C CAGGC C GTGACT GT C 324 9 

TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

| | | | | | | | M I M I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I M I I I I I I I I M 

TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3309 

CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

| | | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II II 

CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3369 



M I I I I I I I I I I I I I I I I II I I I I 

AAGC C CAAT GAT GC GT GTAC AT AA 3393 
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Publication No. US20040029150A1 
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NUMBER OF SEQ ID NOS: 17 9 
SOFTWARE: CuraSeqList version 0.1 
SEQ ID NO 47 
LENGTH: 3165 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY : CDS 
LOCATION: (13) . . (3153) 
US-10-403-676-47 

Query Match 97.8%; Score 3025.8; DB 12; Length 3165; 

Best Local Similarity 98.3%; Pred. No. 0; 

Matches 3088; Conservative 0; Mismatches 2; Indels 51; Gaps 1; 

Qy 1 AT GAGGT CAGAAGCCT TGCT GCT ATATTT CACACT GCTAC ACTTT GCT GGGGCT GGTTT C 60 

| M | | | | | | | | | I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I > I I I I I I I I 

Db 13 ATGAGGTCAGAAGCCTTGCTGCTGTATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 72 

Qy 61 C CAGAAGATT CT GAGC C AAT C AGT ATT T C GCAT GGCAACT AT ACAAAAC AGT AT CC GGT G 12 0 

| | M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 73 C CAGAAGAT T CT GAGC CAAT C AGT ATTT C G CAT GGCAACT AT AC AAAACAGT AT C C GGT G 132 

Q y 121 T T T GT G GGC CACAAGC C AG GAC GGAACACC AC AC AGAG GCAC AGGCT GGAC AT CCAGAT G 180 

| || | | | | | | | | | | I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I i I I I I I M I I I I 
Db 133 T T T GT GGGC CACAAGC CAG GAC GGAACAC C AC ACAGAG GCAC AGGCT GGACAT CCAGAT G 192 



181 ATT AT GAT CAT GAAC GGAAC C CT C T AC AT T GCT G CT AG GGAC CAT ATT TAT AC T GT T GAT 240 

I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
193 AT TAT GAT CAT GAAC GGAAC C CT CT ACAT T G C T GCTAGGGAC CAT ATT TAT ACT GT T GAT 2 52 

241 AT AGACAC AT C ACACAC GGAAGAAAT T TAT T GT AG CAAAAAACT GAC AT GGAAAT CT AGA 300 

| M M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M M I I I I I 
253 ATAGACACAT CACACACGGAAGAAATTT ATT GTAGCAAAAAACT GACAT GGAAAT CT AGA 312 

301 CAGGC CGAT GT AGACAC AT GCAGAAT GAAG GGAAAACATAAG GAT GAGT GC CACAAC T T T 360 

| | I I I I M | I M I II I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I 
313 CAGGC C GAT GT AGACAC AT G C AGAAT GAAGGGAAAACAT AAGGAT GAGT GC CACAACTT T 372 

361 ATT AAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT TGTTTGTCTGT GGAACT AAT GCCT T C 420 

I M I I I I M I I I II I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I II I I I I I I I 
373 ATTAAAGTTCTT CT AAAGAAAAAC GAT GAT GCAT T GTTTGT CT GT GGAACT AAT GCCTT C 4 32 

421 AAC C CT T C CT G CAGAAACT AT AAGAT GGAT ACAT T GGAAC CAT T C GGG GAT GAAT T CAGC 4 80 

I || | | | | | | | I I I I I I I I I I I I I II I I I I M I II I I I I M I I I I I I I I I I I I I M I I I I I 
433 AAC C CT T C CT GC AGAAAC TAT AAGAT GGAT ACAT T GGAAC CAT T C GG GGAT GAATTC AGC 4 92 

481 GGAATGGC CAGAT GCC CATAT GAT GCCAAACATGCCAACGTTGCACT GTTT GCAGAT GGA 540 

I M I I I I I I I I I I I I I I M I M I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I 
4 93 GGAATGGCCAGATGCCCAT AT GAT GCCAAACAT GCCAACGTTGCACT GTTT GCAGAT GGA 552 

541 AAACT ATACT CAGC CAC AGT GACT GACT T C CTT GCC AT T GACGCAGT CAT T TAC C GGAGT 600 

I M I I I I I I II I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I 
553 AAACTAT ACT CAGC CAC AGT GACT GACT T C CTT GCC ATT GACGCAGT CAT T TAC C GGAGT 612 

601 CT T G GAGAAAG C C CT AC CCT GC GGAC C GT CAAGCAC GATT CAAAAT GGT T GAAAGAAC CA 660 

I I I I I M I I I I I I I I I I I I I I I I II I M I I I I M I I I I I I I I I I I I I I I I M I I I I I I M 
613 CT T GGAGAAAGC C CT AC CCT GC G GAC C GT CAAGCAC GAT T CAAAAT GGT T GAAAGAAC CA 672 

661 T ACT T T GTT CAAGC C GT GGATT AC GGAGAT TAT AT CT ACT T CT T CT T CAGG GAAAT AGCA 72 0 

I | | | | | | | | II I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I 
673 TACT TT GTT CAAGC C GT GGATT AC GGAGAT T AT AT CTACT T CT T CT T C AGGGAAAT AGCA 732 

721 GT G GAGTAT AAC AC CAT G GGAAAGGT AGTT TT C C C AAGAGT GGCTC AGGTT T GT AAGAAT 78 0 

I | | | M | | M || | | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I 
733 GT GGAGTATAACACCAT GGGAAAGGT AGTTTT CCCAAGAGT GGCTCAGGTTT GT AAGAAT 792 

781 GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAACAGT GGACGTCGTT CCT GAAGGCGCGC 84 0 

I || | | | | | | | | M I I I I I I I I I I I M I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I 
793 GAT AT GGGAGGATCT CAAAGAGT CCT GGAGAAACAGTGGACGT CGTT CCT GAAGGCGCGC 852 

841 T T GAACTGCT C AGTT C CT GGAGACT CT C AT TT T TAT T T CAAC ATT CT C CAGGC AGT TAC A 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I M I I II I I I I I I I I I I I I I 
853 T T GAACT GCT C AGTT C CT GGAGACT CT C ATT T T TAT TT CAAC ATT CT C C AGGCAGT T ACA 912 

901 GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 960 

I M | | | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I 

913 GAT GT GAT T CGT AT CAAC GGGC GT GATGT T GT C CT G GCAAC GT TTT CT ACACCTT AT AAC 972 

961 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1020 

I | | | I I I M I I I I II I I I I I M I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I 

97 3 AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 1032 



Qy 

Db 



1021 GG GAGATT CAAGGAAC AGAAGT C T C CT GAT T C CAC CT G GACAC CAGTT C CT GAT GAACGA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 

1033 GG GAGATT CAAGGAAC AGAAGT CT C C T GAT T C CAC CT GGAC AC CAGT T C C T GAT GAACGA 1092 



Qy 1081 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1093 GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 1152 

Qy 1141 T CCAAT GAGTTCCCT GAT GATAC CCT GAACTT CAT CAAGACGCACCCGCTCAT GGAT GAG 1200 

I I I I I I I I I I I I I II I I I I I I I I I M I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1153 T C CAAT GAGT T C C CT GAT GAT AC CCT GAACTT CAT CAAGAC GCAC C C GCT CAT GGAT GAG 1212 

Qy 12 01 GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 1260 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II 

Db 1213 GC AGT GCC CT C CAT CT T CAAC AGGC CAT GGTT C CT GAGAACAAT G GT CAGAT AC C GC CT T 1272 

Qy 1261 AC CAAAAT T GC AGT GGACACAGCT G CT G G GC CATAT CAGAAT C ACACT GT GGT T TT T CT G 1320 

I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1273 AC CAAAAT T GCAGT GGACACAGCT GCT GGGC CATAT CAGAAT C ACACT GT GGTTTTT CT G 1332 

Qy 1321 GGAT C AGAGAAGG GAAT C AT CT T GAAGT T T TT GGC C AGAATAGGAAAT AGTGGT T T T CT A 138 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1333 GGAT C AGAGAAGG GAAT C AT CT T GAAGT T T T T GGC C AGAATAGGAAAT AGT GGT T T T CT A 1392 

Qy 1381 AATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTACAACTCTGAAAAATGCAGCTATGAT 14 40 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II 
Db 1393 AAT GACAGC CT T T TC CT GGAG GAGAT GAGT GT TTAC AACT CT GAAAAAT G CAGCT AT GAT 14 52 

Qy 1441 G GAGT C GAAGACAAAAGGATC AT GGGCAT GCAG CT GGACAGAGCAAGCAGCT CT CT GTAT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1453 GGAGT C GAAGACAAAAGGAT CAT G GGCAT GCAGCT GGACAGAGCAAG CAGCT CT CT GTAT 1512 

Qy 1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1513 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1572 

Qy 1561 T GTAAAAAAACCT GT ATT GCCT CCAGAGACCCATATTGTGGAT GGAT AAAGGAAGGTGGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1573 T GT AAAAAAAC CT GT ATT GCCT C C AGAGAC C C GTAT T GT GGAT GGAT AAAGGAAG GT GGT 1632 

Qy 1621 GC CT GCAG C CAT T TAT CAC CCAAC AGCAGACT GACT TT T GAG CAG GAC AT AGAGC GT GGC 1680 

I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1633 GCCT G CAGC CAT T TAT CAC CCAAC AG CAGACT GACT TT T GAG CAGGAC AT AGAGC GTGGC 1692 

Qy 1681 AAT AC AGAT GGT C T GGG GGAC T GT C ACAAT T C CTT T GT GG CAC T GA 1726 

I II II I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I II II I I I I 
Db 1693 AAT AC AGAT GGT CT GGGGGACT GT CACAATT CCTTT GT GGC ACT GAAT GACATTTCAACT 1752 

Qy 1727 : AT GGGCATTC CAGTT CCCTCTTG 1749 

I I I I I I I I I I I I I I I I I I II I I I 
Db 1753 C CT CT AC CAGAT AAT GAAAT GT CT T ACAACAC AGT GTAT G G GCAT T CC AGTT C CCT CT T G 1812 

Qy 1750 C CCAGCACAACCACATCAGATT CGACGGCTCAAGAGGGGTAT GAGT CTAGGGGAGGAAT G 18 09 

I I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I I I I I I I 
Db 1813 CCCAGCACAACCACATCAGATT CGACGGCTCAAGAGGGGTAT GAGT CTAGGGGAGGAAT G 1872 

Qy 1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 1869 



Db 1873 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 1932 

Qy 187 0 T C CCAT AAT CAC CAAGACAAGAAGGGAGT GAT T C G G GAAAGT TAC CT CAAAGG C C ACGAC 1929 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I ! I I I I I I I I I I I I II 
Db 1933 T C CCATAATCACCAAGACAAGAAGGGAGT GAT TCGG GAAAGT TAC CT CAAAGGCCACGAC 1992 

Qy 1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 1989 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1993 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 2052 

Qy 1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2049 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I 

Db 2053 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2112 

Qy 2050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I 

Db 2113 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2172 

Qy 2110 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2169 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 2173 AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 2232 

Qy 2170 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2229 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2233 ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 2292 

Qy 22 30 AAAGCAG ACC AGCAC CAC CT GGAC CT GAC GGCCCTCCC CAC C CCAGAGT C AAC C C C AAC G 2289 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 93 AAAGCAGAC CAGC AC CAC CT GGAC CT GAC GGC CCT CC C CAC C CCAGAGT CAAC C C CAACG 2352 

Qy 22 90 CTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAACCAGAACCTC 2349 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 2353 CT GCAGC AGAAG C G GAAGCC C AGC CGC G G C AGCC GCGAGT GG GAGAG GAACCAGAAC CT C 2412 

Qy 2350 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 2409 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2413 ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 2472 

Qy 2410 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 24 69 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2473 CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 2532 

Qy 24 70 GGCT ACCAGCAT GAG TAC GT GGAC CAGC CCAAAAT GAGCGAGGT GGCCCAGATGGCGCTG 2529 

I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2533 GGCT AC CAGC AT GAGTAC GT GGAC CAGC CCAAAAT GAGCGAGGT GGC C CAGAT GGCG CT G 2 592 

Qy 2530 GAGGACCAGGCCGC CACACT GGAGTATAAGACCAT CAAGGAACATCT CAGCAGCAAGAGT 258 9 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I 

Db 2593 GAGGAC CAGGC CGCCACACT GGAGTATAAGACCAT CAAGGAACAT CT CAGCAGCAAGAGT 2652 

Qy 2590 CCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAG 264 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2653 C CC AAC C AT GGGGT GAAC CT T GT GGAGAAC C T GGAC AG C CT G C C C CC CAAAGTT C CAC AG 2712 

Qy 2650 CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2709 

I I M I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 



2713 



CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 2772 



Qy 2710 CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTAT7^AGAGGAGCTACCCCACGAAC 2769 

II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2773 CT G GAAAT GC ACC AC TCCTCTTCC T AC GGGGT T GACT AT AAGAGGAGCT AC C C C ACGAAC 2832 

Qy 2770 T CG CT CAC GAGAAGC C AC CAG GCC AC C ACT CT CAAAAGAAACAACACT AACT C CT CCAAT 282 9 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II I I I I I I I I I I I 
Db 2 833 T CGCT CAC GAGAAGC CAC C AGGC CAC CACT CT CAAAAGAAACAACACTAACT C CT CCAAT 2892 

Qy 2 830 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 288 9 

I | M II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2893 TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 2952 

Qy 2890 CAGAGG GT GG ACT C CAT C CAG GT GCACAGCT CC C AG C CAT CT GGC C AGGC C GT GACT GTC 294 9 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 953 CAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCCAGGCCGTGACTGTC 3012 

Qy 2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I 1 I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 3013 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3072 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 3073 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3132 

Qy 3070 AAGCCCAAT GAT GCGT GTACA 3090 

I I I I I I I I I I I I II II I M I I 
Db 3133 AAGC C C AAT GAT G C GT GTACA 3153 



RESULT 14 
US-10-449-548-47 

Sequence 47, Application US/10449548 
Publication No. US20040018977A1 
GENERAL INFORMATION: 
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APPLICANT: Zhong, Mei 
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FILE REFERENCE: 15966-54 0CIP2 
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CURRENT FILING DATE: 2003-05-30 
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PRIOR FILING DATE: 2000-03-03 
PRIOR APPLICATION NUMBER: 60/123,667 
PRIOR FILING DATE: 1999-03-09 
PRIOR APPLICATION NUMBER: 60/234,082 
PRIOR FILING DATE: 2000-09-20 



; PRIOR APPLICATION NUMBER: 60/233,798 
; PRIOR FILING DATE: 2000-09-19 

PRIOR APPLICATION NUMBER: 60/174,485 
; PRIOR FILING DATE: 2000-01-04 
; PRIOR APPLICATION NUMBER: 10/403,676 
; PRIOR FILING DATE: 2003-03-31 
; PRIOR APPLICATION NUMBER: 60/371,002 
; PRIOR FILING DATE: 2002-04-09 
; PRIOR APPLICATION NUMBER: 60/384,798 
; PRIOR FILING DATE: 2002-05-30 

PRIOR APPLICATION NUMBER: 60/402,407 
; PRIOR FILING DATE: 2002-08-09 
; PRIOR APPLICATION NUMBER: 60/443,062 
; PRIOR FILING DATE: 2003-01-28 
; NUMBER OF SEQ ID NOS : 58 
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; SEQ ID NO 47 

LENGTH: 3165 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (13).. (3153) 
US-10-449-548-47 

Query Match 97.8%; Score 3025.8; DB 15; Length 3165; 

Best Local Similarity 98.3%; Pred. No. 0; 

Matches 3088; Conservative 0; Mismatches 2; Indels 51; Gaps 1; 

1 ATGAGGTCAGAAGCCTTGCTGCTATATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 60 

II M M I I I I I I I I I I I I I I I I I II I II I M I I I I M I I I I I I I I M I I I I I II 

13 ATGAGGTCAGAAGCCTTGCTGCTGTATTTCACACTGCTACACTTTGCTGGGGCTGGTTTC 72 

61 CCAGAAGAT T CT GAGC CAAT CAGT AT T T C G CAT G GCAACT AT ACAAAAC AGT AT C C GGT G 12 0 

| | | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I M I M I I I I I I I I M I M I I II I II I I I 
73 C CAGAAGAT T CT GAGC CAAT CAGT AT T TC G CAT GGCAACT AT ACAAAAC AGT AT CC GGT G 132 

121 TTT GT GGGCCACAAGCCAGGACGGAACACCACACAGAGGCACAGGCT GGACAT C CAGAT G 18 0 

I | | | || I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I II M I I I I I M I M 

133 T T T GT GGGC CACAAGC CAGGAC GGAAC AC CACACAGAGGCACAGGCT GGACAT C CAGAT G 192 
181 AT TAT GAT C ATGAAC GGAACC CT CT ACAT T GCT GCT AG GGAC C AT ATTT AT ACT GT T GAT 24 0 

I I I I I I I I I I M M I M I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

193 AT TAT GAT CAT GAAC G GAAC C CT CT ACAT T GC T GCT AGGGAC CAT AT TT AT ACT GT T GAT 252 

241 AT AGACAC AT C ACAC ACGGAAGAAAT TT AT T GT AGCAAAAAACT GACAT G GAAAT CT AGA 300 

| | | | | | I I I I I I I I I I I II I I M I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I 
253 ATAGACACATCACACACGGAAGAAATTTATTGTAGCAAAAAACTGACATGGAAATCTAGA 312 

301 CAGGC C GAT GT AGACAC AT GC AGAAT GAAGGGAAAACATAAGGAT GAGT GC C ACAACT T T 360 

| | | | | | | | I I I I I I I I I I M I I II I I I II I I I I I I I I M I I M I II I I I I II I I I I M I I 
313 CAGGCCGAT GT AGACACAT GCAGAAT GAAGGGAAAACATAAGGAT GAGTGCCACAACTTT 372 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



Qy 361 AT TAAAGT T CT T CT AAAGAAAAAC GAT GAT GCAT T GTT T GT CT GT GGAACT AAT GC CT T C 420 

| M I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I II I I 
D b 373 AT TAAAGT T CT T CTAAAGAAAAAC GAT GAT GCAT T GT T T GT CT GT GGAACT AAT GC CT T C 432 



Qy 


421 


AAC CCTTCCTG CAGAAACT AT AAGAT GGAT ACAT T G GAAC CAT T C GGGGAT GAAT T C AGC 


480 




I M 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 






433 


AAC C CTT C CT GCAGAAACT AT AAGAT G GAT ACAT T GGAAC CAT T C G GGG AT GAAT TCAGC 


492 


Qy 


481 


GGAAT GGC CAGAT GC C CAT AT GAT GC CAAAC AT GCCAAC GTT G CACT GT TT GCAGAT GGA 


540 




I | | | | | | | 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




DD 


493 


GGAAT GGC CAGAT G C C CAT AT GAT GC CAAAC AT G C CAAC GTT GC ACT GT T T GCAGAT GGA 


552 


Qy 


541 


AAACT AT ACT C AGC C AC AGT GACT GACT T C CTT GC CAT T GAC GCAGT CAT T TAC C GGAGT 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 




DD 


s 

j jj 


AAArTATAPTrAG;CCACAGTGACTGACTTCCTTGCCATTGACGCAGTCATTTACCGGAGT 


612 


Qy 


601 


CTTGGAGAAAGCCCTACCCTGCGGACCGTCAAGCACGATTCAAAATGGTTGAAAGAACCA 


660 




1 I I I I I I I I 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 II 1 1 1 1 1 1 1 1 1 1 




JJD 


o ± o 


CT T GGAGAAAGC CCT ACC C T G C GGAC C GT CAAGC AC GAT T CAAAAT G GT T GAAAGAAC CA 


672 


Qy 


661 


T ACT TT GT T CAAG C C GT G GAT T ACGGAGAT TAT AT CT ACTT CT T CT T CAGGGAAAT AGCA 


720 




I | 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 M 1 1 1 1 




DD 


D / O 


T A r T TT r^T TP A A cic C AT T AC GGAGAT TAT AT CT ACTT CT T CT T C AG GGAAAT AGCA 


732 


Qy 


721 


GT GGAGT AT AACAC CAT G GGAAAGGT AGT T T T CC CAAGAGT GGCT CAG GT TT GT AAGAAT 


780 




1 I II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


7 "3 "3 


r^T r; A r;T AT A A r AC C AT GGGAAAGGT AGTTT T C C CAAGAGT GGCT CAGGT TT GTAAGAAT 


792 


Qy 


781 


GATATGGGAGGATCTCAAAGAGTCCTGGAGAAACAGTGGACGTCGTTCCTGAAGGCGCGC 


840 




I I I I I I I I I 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




DD 




r ATATr*r:r^Ar;nATrTrAAAr;Ar;TrrTGGAGAAACAGTGGACGTCGTTCCTGAAGGCGCGC 


852 


Qy 


841 


TTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 


900 




1 I I 1 I 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 




UD 


QC.O 
OJJ 


TTTAAPTr^rTP AnTTPrTnGAGArTrTCATTTTTATTTCAACATTCTCCAGGCAGTTACA 


912 


Qy 


901 


GATGTGATTCGTATCAACGGGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


960 




I I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II I II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




UD 


Q1 O 

y ± 3 


r ATr^Tr^ATTrnTATP AACt^nGCGTGATGTTGTCCTGGCAACGTTTTCTACACCTTATAAC 


972 


Qy 


961 


AGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1020 




1 I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


Q "7 "5 


nrr ATrrrTrrnTrTrrrAf^TrTnTCCCTATGACATGCTTGACATTGCCAGTGTTTTTACT 


1032 


Qy 


1021 


GGGAGATTCAAGGAACAGAAGTCTCCTGATTCCACCTGGACACCAGTTCCTGATGAACGA 


1080 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


XU JJ 


GGGAGATT CAAGGAAC AGAAGT CT C C T GATT C CAC CT GGAC AC C AGT T C CT GAT GAAC GA 


1092 


Qy 


1081 


GTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCAACC 


1140 




II | | 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 




JJD 


1 OQ^ 

XU j J 


nTTrrTAAf^rrrA(^GrrAGGTTGCTGTGCTGGCTCATCCTCCTTAGA7\AGATATGCAACC 


1152 


Qy 


1141 


T C CAAT GAGT T C C CT GAT GAT AC C CT GAACT T CAT C AAGACGC AC CC GCT CAT GGAT GAG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 




UD 


J. J. J J 


T C CAAT GAGT T C CCT GAT GAT AC CCT GAACT T CAT CAAGAC GC AC C C GCT CAT GGAT GAG 


1212 


Qy 


1201 


GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGG1 uAGA1ACU(jLa_.x 1 


1 9 AH 
1ZDU 




1 1 1 1 M 1 1 II 1 1 II 1 1 1 1 1 M 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1213 


GCAGTGCCCTCCATCTTCAACAGGCCATGGTTCCTGAGAACAATGGTCAGATACCGCCTT 


1272 


Qy 


1261 


ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 


1320 



1273 ACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACACTGTGGTTTTTCTG 1332 

1321 GGAT C AGAGAAGGGAAT CAT CT T GAAGT T T T T GG C CAGAAT AGGAAAT AGT GGT T T T CTA 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1333 GGAT C AGAGAAGGGAAT CAT C T T GAAGT T T T T GG C CAGAAT AGGAAAT AGT GGT T T T CTA 1392 

1381 AAT GACAGCCTTTT CCT GGAGGAGATGAGT GTTTACAACT CT GAAAAAT GCAGCTATGAT 144 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
1393 AAT GACAGCCTTTT CCT GGAGGAGATGAGT GTTTACAACT CT GAAAAAT GCAGCTATGAT 1452 

14 41 GGAGT C GAAGACAAAAGGAT CAT GGGC AT G C AGCT GGACAGAGCAAGC AG C T CT CT GT AT 1500 

I I M I I I I M I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
14 53 GGAGT C GAAGACAAAAGGAT CAT G GGC AT GC AGCT GGACAGAGCAAGC AGCT CT CT GT AT 1512 

1501 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1513 GTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTGAACGACATGGGAAG 1572 

1561 T GT AAAAAAAC CT GT AT T GC CT C C AGAGAC C CAT ATT GT GGAT GGAT AAAGGAAGGT GGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1573 T GT AAAAAAAC CT GT AT T GCCT C C AGAGAC C C GT ATT GT GGAT GGAT AAAG GAAGGT GGT 1632 

1621 GCCT GCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGT GGC 168 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1633 GCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGGACATAGAGCGTGGC 1692 

1681 AATACAGATGGTCTGGGGGACTGTCACAATTCCTTTGTGGCACTGA 1726 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1693 AAT AC AGAT G GT CT GGGG GACT GT CACAAT TCCTTTGT GGC ACT GAAT GAC ATT T CAACT 1752 

1727 ATGGGCATTCCAGTTCCCTCTTG 174 9 

I I I I I I I I I I I I I I I I I I I I I I I 
1753 CCT CT AC CAGATAAT GAAAT GT CT T ACAAC ACAGT GT AT G GGCAT TC CAGT T C C CT CT T G 1812 

1750 C C C AGCACAAC CACAT C AGAT TC GAC G GCT CAAGAG GGGT AT GAGT CT AG G GGAGGAATG 1809 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1813 C C C AGCACAAC CACAT C AGAT T C GAC G GCT CAAGAGGGGT AT GAGT CT AGGGGAGGAAT G 1872 

1810 CTGGACTGGAAGCATCTGCTTGACTCACCTGACAGCACAGACCCTTTGGGGGCAGTGTCT 1869 

I I I I I I I I I I I M II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1873 CT GGACT GGAAGCATCT GCTT GACTCACCT GACAGCACAGACCCTTT GGGGGCAGT GT CT 1932 

1870 T C C CAT AAT C AC C AAG AC AAG AAG G GAGT GAT T C G G G AAAGT T AC C T C AAAG G C C AC GAC 192 9 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I II II I I I I I I I I I M I 
1933 T C C CAT AAT C AC CAAGACAAGAAGGGAGT GATT C GGGAAAGTT ACCT CAAAGGC CAC GAC 1992 

1930 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 198 9 

I I I I I I I I I I I I I I I I II I I I I M I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1993 CAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTTTCGTCATGGGGGCC 2052 

1990 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 204 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 053 GTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCAAAGACGTGGCTGTG 2112 



2 050 GTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCATGAGCAGCGTCACC 2109 
I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I II I I I I II I I M I I I I I 



UD 


91 1 ^ 

c. X. X. O 


GT GC AGC GCAAG GAGAAG GAGCT C AC C C ACT CGCGCCGGGGCTC CAT GAGCAGC GT C AC C 


2172 


Qy 


2110 


AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 


2169 




I I 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 




UiJ 


2173 


AAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGCCGGAGGCCATCCTC 


2232 


QY 


2170 


ACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 


2229 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


99 ^ ^ 


Arr;rrArTCATGrACAACGGCAAGCTCGCCACTCCCGGCAACACGGCCAAGATGCTCATT 


2292 


Qy 


2230 


AAAGCAGAC C AGC AC CAC CT GGAC CT GAC GGC CCT CC C CAC C CCAGAGT CAACC C CAACG 


2289 




II | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


99 Q ^ 

Z Z _? o 


A A Ann AGArr AGrArrArrTGGACCTGACGGCCCTCCCCACCCCAGAGTCAACCCCAACG 


2352 


Qy 


2290 


CTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGAGGAACCAGAACCTC 


2349 




I I I I I I M I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 II 1 




UD 


9 m ^ 


rTrr arr ap AAnrr,f;AA(=:rrr AGrrGrGGCAGCCGCGAGTGGGAGAGGAACCAGAACCTC 


2412 


Qy 


2350 


ATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGATTCCCACGGACCTG 


2409 




1 1 1 1 1 M I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


Z X. .3 


ATr a at rr rTrr Ar a A AP^Ar AT GrrrcrrATGGGCTCCCCTGTGATTCCCACGGACCTG 


2472 


Qy 


2410 


CCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGCCCATCACGCAGCAG 


2469 




II 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




DD 


O A 1 ^ 


rrrrTr rrrrrrTrrrrr Anrr Ar ATrrrr AGrGTGGTGGTCCTGCCCATCACGCAGCAG 


2532 


Qy 


2470 


GGCTACCAGCATGAGTACGTGGACCAGCCCAAAATGAGCGAGGTGGCCCAGATGGCGCTG 


2529 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 




rrrT&rr ArrATP,AP,TAr p,ti^PtAPP APrPPP AAA ATGAGPGAGGTGGCCCAGATGGCGCTG 

Vjvjv- X .Tt.v^ v^.tt.v7 v,xA X X r\\_- vrr X vr v7.tt.v- v-/t. vj v- v»- ^rVrvTLrV J. uAu V- vj/Ivj vj x v-.nAJ.r-i. j. vjvj^^jv-- x \j 


2592 


Qy 


2530 


GAGGACCAGGCCGCCACACTGGAGTATAAGACCATCAAGGAACATCTCAGCAGCAAGAGT 


2589 




1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




UD 


Z JJJ 


PAPP APPAPPPPnPPAPArTGGAGTATAAGAPCATCAAGGAACATCTCAGCAGCAAGAGT 


2652 


Qy 


2590 


CCCAACCATGGGGTGAACCTTGTGGAGAACCTGGACAGCCTGCCCCCCAAAGTTCCACAG 


2649 




1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 




ppp A APP AT PHPtPtTPt A APPTTGTGGAGAACPTGGACAGCCTGCCCCCCAAAGTTCCACAG 


2712 


Qy 


2650 


CGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCGGTCTAAGCAAGCGG 


2709 




1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




JJD 


971 ^ 
z / x o 


ppppapppptppptgggtpppppgggagpctppptgtctcagaccggtctaagcaagcgg 

V^, \j V7 V7jV VJ V7 v V»- X v*- v V-» X VJVJVJ J. V_* V- V* V- V* V7 VJ vZJ.TT.VJ V- V^ x w — X V7 X V x \~r nun W VJ X v_> X J u IVJ vj u i-v w 


2772 


Qy 


2710 


CTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 


2769 




1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




JJD 


0111. 
Z / / o 


rTrr AA ATr,r Arr ArTrrTrTTPPTACGGGGTTGACTATAAGAGGAGCTACCCCACGAAC 


2832 


Qy 


2770 


TCGCTCACGAGAAGCCACCAGGCCACCACTCTCAAAAGAAACAACACTAACTCCTCCAAT 


2829 




1 I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




nK 
JJD 


ZOO J 


T r r r T r A r C A G A AGr r AG C AGGr r AG C ACT CT C AAAAGAAACAACACTAACT CCTCCAAT 


2892 


Qy 


2830 


TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 


2889 




II I I I | M 1 1 1 II II II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


2893 


TCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACCCGCCGCCCGCCCCG 


2952 


Qy 


2890 


CAGAGG GT GGACT CC AT C CAG GT GC ACAG C T C C C AG CCAT CT G GC C AGGC CGT GACT GT C 


2949 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


2953 


CAGAGGGT G GACT CCATC CAGGT GCACAG CT C C CAGC C AT CT G GCC AG G C CGT GAC T GT C 


3012 



Qy 2950 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3009 

I I I I I I I I I I I M II I I ! I I I I I I M I M I M I I I I I I I I I I I I I I I I I I I I I I I M I M 
Db 3013 TCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGGGGCTGAAGCGTACG 3072 

Qy 3010 CCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3069 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I 

Db 3073 CCCTCGCT7\AAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCCTTTCCACATCCATG 3132 

Qy 3070 AAGC C CAAT GAT GC GT GT ACA 3090 

II I I I I I I I I I I I I I I I I I I I 

Db 3133 AAG C C CAAT GAT G C GT GT AC A 3153 



RESULT 15 
US-10-403-676-17 

; Sequence 17, Application US/10403676 
; Publication No. US20040029150A1 
; GENERAL INFORMATION: 



APPLICANT: 


Alsobrook 


II, John 


APPLICANT: 


Anderson 


, David W. 


APPLICANT: 


Boldog, 


Ferenc L. 


APPLICANT: 


Burgess, 


Catherine E. 


APPLICANT: 


Casman, 


Stacie J. 


APPLICANT: 


Edinger, 


Shlomit R. 


APPLICANT: 


Gerlach, 


Valerie L. 


APPLICANT: 


Grosse, 


William M. 


APPLICANT' 


Guo, Xia 


o jia 


APPLICANT 


Gusev, Vladimir Y. 


APPLICANT 


Ji, Weiz 


hen 


APPLICANT 


LaRochelle, William J. 


APPLICANT 


Lepley, 


Denise M. 


APPLICANT 


Li, Li 




APPLICANT 


Liu, Xia 


ohong 


APPLICANT 


MacDougall, John R. 


APPLICANT 


Malyanka 


r, Uriel M. 


APPLICANT 


: Millet, 


Isabelle 


APPLICANT 


: Padigaru 


, Muralidhara 


APPLICANT 


: Patturaj 


an, Meera 


APPLICANT 


: Peyman, 


John A. 


APPLICANT 


: Rastelli 


, Luca 


APPLICANT 


: Reiger, 


Daniel 


APPLICANT 


: Rothenberg, Mark E. 


APPLICANT 


: Shimkets 


, Richard A. 


APPLICANT 


: Stone, David J. 


APPLICANT 


: Taupier, 


Raymond J. 


APPLICANT 


: Vernet, 


Corine 


APPLICANT 


: Zerhusen 


, Bryan D. 



; TITLE OF INVENTION: THERAPEUTIC POLYPEPTIDES, NUCLEIC ACIDS ENCODING SAME, 

AND METHODS OF USE 

; FILE REFERENCE: 21402-573B 

; CURRENT APPLICATION NUMBER: US/10/403, 676 

; CURRENT FILING DATE: 2003-03-31 

; PRIOR APPLICATION NUMBER: 60/123,667 

; PRIOR FILING DATE: 1999-03-09 

; PRIOR APPLICATION NUMBER: 09/520,781 

; PRIOR FILING DATE: 2000-03-08 



; PRIOR APPLICATION NUMBER: 09/957,187 

; PRIOR FILING DATE: 2001-09-19 

; PRIOR APPLICATION NUMBER: 60/371,002 

; PRIOR FILING DATE: 2002-04-09 

; PRIOR APPLICATION NUMBER: 60/127,352 

; PRIOR FILING DATE: 1999-04-01 

; PRIOR APPLICATION NUMBER: 09/538,092 

; PRIOR FILING DATE: 2000-03-29 

; PRIOR APPLICATION NUMBER: 09/604,286 

; PRIOR FILING DATE: 2000-06-22 

PRIOR APPLICATION NUMBER: 60/140,584 
; PRIOR FILING DATE: 1999-06-23 
; PRIOR APPLICATION NUMBER: 60/370,381 
; PRIOR FILING DATE: 2002-04-05 
; PRIOR APPLICATION NUMBER: 60/384,297 
; PRIOR FILING DATE: 2002-05-30 

Remaining Prior Application data removed - See File Wrapper or PALM. 
; NUMBER OF SEQ ID NOS : 17 9 
; SOFTWARE: CuraSeqList version 0.1 
; SEQ ID NO 17 

LENGTH: 3106 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 

NAME/ KEY: CDS 

LOCATION: (2).. (3106) 
US-10-403-676-17 

Query Match 96.2%; Score 2975; DB 12; Length 3106; 

Best Local Similarity 98.2%; Pred. No. 0; 

Matches 3039; Conservative 0; Mismatches 5; Indels 51; Gaps 1; 

Qy 47 CTGGGGCT GGTT T CC C AGAAGAT T CT GAG C CAAT CAGTATT T C GC AT GGCAACT AT ACAA 106 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I 

Db 3 C C G GAT CC GGTT T CC C AGAAGAT T C T GAGC CAAT CAGT AT TT C GC AT GGCAACTATACAA 62 

Qy 107 AACAGTAT CCGGTGTTTGTGGGC CACAAGC CAGGAC GGAACAC CAC ACAGAGGCACAGGC 166 




Db 



63 AACAGTAT C C GGT GT T T GT GGGC CACAAGC CAGGAC GGAACAC C AC ACAGAGG CACAGGC 122 



Qy 



167 T GGAC AT C C AGAT GAT TAT GAT CAT GAAC GGAAC C CT CT ACAT T G CT GCT AG GGAC CAT A 22 6 




Db 



123 T GGACATC CAGAT GATTAT GAT CAT GAACGGAACCCT CT ACATT GCT GCTAGGGACCAT A 182 



Qy 



227 T T TAT ACT GT T GAT AT AGACAC AT CACAC AC GGAAGAAATTT AT T GT AG CAAAAAACT GA 2 8 6 




Db 



18 3 T T TAT ACT GT T GAT AT AGACAC AT CACAC AC GGAAGAAAT TT AT T GT AGCAAAAAACT GA 242 



Qy 



287 C AT GGAAAT CT AGAC AGGC C GAT GT AGACAC AT GC AGAAT GAAGGGAAAACAT AAGGAT G 34 6 




Db 



24 3 CAT GGAAAT CT AGAC AGGC C GAT GT AGAC AC AT GC AGAAT GAAGGGAAAACAT AAGGAT G 302 



Qy 



Db 



347 AGT GC CACAAC T T TAT T AAAGT T CT T CT AAAGAAAAAC GAT GAT GC AT T GTT T GT CT GT G 406 

I M I I I I I I I I M II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I 
303 AGT GC CACAACT T TAT T AAAGT T CT T CT AAAGAAAAAC GAT GAT G CAT T GTT T GT CT GT G 362 



Qy 



407 GAACTAAT GCCTTCAACCCTT C CT GCAGAAACTAT AAGATGGAT ACATT GGAACCATT CG 4 66 



Db 


363 


Qy 


467 


Db 


423 


Qy 


527 


Db 


483 


Qy 


587 


Db 


543 


Qy 


647 


Db 


603 


Qy 


707 


Db 


663 


Qy 


767 


Db 


723 


Qy 


827 


Db 


783 


Qy 


887 


Db 


843 


Qy 


947 


Db 


903 


Qy 


1007 


Db 


963 


Qy 


1067 


Db 


1023 


Qy 


1127 


Db 


1083 


Qy 


1187 


Db 


1143 



I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

GAACT AATGC CT T CAAC C CT T CCT GCAGAAACT ATAAGAT GGAT ACAT T GGAAC CAT T C G 422 
GG GATGAAT T CAGC GGAAT G G C CAGAT GC C CAT AT GAT G C CAAACAT G C CAAC GTT GCAC 52 6 

I I I M I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

GGGATGAATT CAGCGGAAT GGCCAGAT GCCCATATGATGCCAAACAT GCCAAC GTT GCAC 482 

T GT T T GCAGAT GGAAAACT AT ACT CAGC C ACAGT GACT GACTT C CT T G C C ATT GAC GCAG 58 6 
| I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
TGTTT GCAGATGGAAAACT ATACT CAGCCACAGT GACTGACTT CCTT GCCATT GACGCAG 542 

T C ATTT AC C G GAGT CT T GGAGAAAGCC CT ACC CT GC GGAC C GT CAAGCAC GAT T CAAAAT 64 6 

M I I I I M I I I I I I I I I M I I I I I II I I I II I I I I I II I I I I I M I I I I I I I I I I I I I I I 

T C ATT T AC C G GAGTCT T GGAGAAAGC C CT ACC CT GCGGAC C GT CAAGCAC GAT T CAAAAT 602 
G GT T GAAAGAAC CAT ACTT T GT T CAAGCC GTGGAT T ACGGAGAT TAT AT C T ACTT CTT CT 706 

I | I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I 

GGT T GAAAGAAC CAT ACT T T GT T CAAG CC GT G GAT T AC GGAGAT TAT AT CT ACT T CT T C T 662 
T CAGGGAAATAGCAGT GGAGTATAACACCATGGGAAAGGTAGTTTTCCCAAGAGT GGCT C 766 

I I I I M I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I II I I 

T C AGG GAAAT AGCAGT GGAGT AT AACAC CAT GGGAAAG GT AGT T T T C CCAAG AGT GGCT C 722 
AGGT T T GT AAGAATGAT AT GG G AGGAT CT CAAAGAGT C CT GGAGAAACAGT GGAC GT CGT 82 6 

I | I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I M 

AGGT T T GTAAGAAT GAT AT GGGAGGAT CT CAAAGAGT CCT GGAGAAAC AGTGGAC GT C GT 7 82 

TCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTC 8 8 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCTGAAGGCGCGCTTGAACTGCTCAGTTCCTGGAGACTCTCATTTTTATTTCAACATTC 8 42 

T C CAGGCAGT T ACAGATGT GAT T C GTAT CAAC G GG C GT GAT GT T GT CCT GGCAAC GTT T T 94 6 
I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I 
T C CAGGCAGTT ACAGAT GT GAT T C GTAT CAAC GGGC GT GAT GT T GT CCT GGCAACGTT T T 902 

CTACACCTTATAACAGCAT CC CTGGGTCT GCAGT CTGT GCCTATGACATGCTT GACATT G 1006 
I I M I I I I I I M I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTACACCTTATAACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTG 962 

C CAGT GT T T T TACT GGGAGAT T CAAGGAACAGAAGT CT C CT GAT T C C AC CT G GACACC AG 1066 
I | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I M I I I I I I I I I M 
C CAGT GT T TT T ACT GGGAGAT T CAAGGAACAGAAGT CT CCT GAT T C C AC CT GGAC AC CAG 1022 

TTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAG 1126 

I | | | | || | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I II I I I I I I I I I 

TTCCTGATGAACGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAG 1082 

AAAGAT AT GC AAC CT C CAAT GAGT T CC CT GAT GAT AC CCT GAACT T CAT C AAGAC GC AC C 1186 

I | | I I I II I I I I I I I I I I I II I I I I I II I I I M I II M I I I I I I I I I I II M I I II I II I 

AAAGAT AT G C AAC CT C CAAT GAGT T CC CT GAT GAT AC C CT GAACT T CAT CAAGAC GC ACC 1142 

C GCT CAT G GAT GAGGCAGT GC CCT C CAT CT T CAACAGGCC AT G GT T C CT GAGAACAAT GG 124 6 
| | I I I I I M I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCT CAT GGAT GAGGCAGTGC CCT CCAT CTT CAACAGGCCATGGTTCCTGAGAACAATGG 1202 



Qy 1247 



T CAGAT AC C GC CT T AC CAAAATT GCAGT GGACAC AGCT GCT GGGCCAT AT CAGAAT CACA 1306 

| | || | | | | | | | | I I I I I I I II I II I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 



Db 1203 TCAGATACCGCCTTACCAAAATTGCAGTGGACACAGCTGCTGGGCCATATCAGAATCACA 1262 

Qy 1307 CTGTGGTTTTT CT GGGAT CAGAGAAGGGAAT CAT CTT GAAGT TT TT GGC CAGAAT AGGAA 1366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 1263 CTGTGGTTTTTCT GGGAT CAGAGAAGGGAAT CAT CTTGAAGTTTTTGGCCAGAAT AGGAA 1322 

Qy 1367 ATAGTGGTTTTCTAAATGACAGCCTTTTCCTGGAGGAGATGAGTGTTTACAACTCTGAAA 1426 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M 
Db 1323 ATAGT GGT TT T CT AAAT GAC AGC CT T T T CCT GGAGGAGAT GAGT GTT T ACAACT C T GAAA 1382 

Qy 1427 AAT GCAGCT AT GAT GGAGT C GAAGACAAAAGGAT CAT GGGC AT GCAGCT GGACAGAGCAA 148 6 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I 
Db 1383 AAT GC AG CT AT GAT GGAGT C GAAGAC AAAAG GAT CAT GGG CAT GCAG CT GGACAGAGCAA 1442 

Qy 14 87 GCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTG 154 6 

I I I I I I I I I I I I I I II I I M I II I I I I I I I I I I I I I II I I I M I I I I I I I I I I II M I I I 

Db 1443 GCAGCTCTCTGTATGTTGCGTTCTCTACCTGTGTGATAAAGGTTCCCCTTGGCCGGTGTG 1502 

Qy 1547 AAC GAC AT G GGAAGTGTAAAAAAAC CT GT AT T GC CT C CAGAGAC C CAT AT T GT GGAT GGA 1606 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1503 AAC GAC AT GG GAAGT GT AAAAAAAC CT GT AT T GC CT C CAGAGAC C C GT AT T GT GGAT GGA 1562 

Qy 1607 T AAAGGAAGGT GGT GC CT GC AGC CAT T TAT CAC C CAACAGCAGACT GACT T T T GAGC AGG 1666 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1563 TAAAGGAAGGTGGTGCCTGCAGCCATTTATCACCCAACAGCAGACTGACTTTTGAGCAGG 1622 

Qy 1667 ACAT AGAGC GT GGCAAT AC AGAT GGT CT GGG GG ACT GT C ACAAT T C CT T T GTGG CACT GA 1726 

I | | | I I I II I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 AC AT AGAGC GT GGCAAT AC AGAT GGT CT GG GG GACT GT C ACAAT T CCT T T GT G GCACT GA 1682 

Q y 1727 ATGGGCATT 17 35 

I I I I I I I I I 

Db 1683 AT GACATTT CAACTCCT CT ACCAGATAAT GAAAT GT CTTACAACACAGT GTAT GGGCATT 1742 

Qy 1736 CC AGT TCCCTCTTGCC CAGCACAACC ACAT CAGAT T C GAC GGCT CAAGAGG GGT AT GAGT 1795 

I M I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I II I I I II I I I I I I I MM I I I I I I 

Db 1743 C CAGT TCCCTCTTGCC CAGCACAAC C ACAT CAGAT T C GAC GGCT CAAGAGGGGT AT GAGT 1802 

Qy 1796 CT AGG GGAGGAAT GCT GGACT G GAAG CAT C T GCT T GACT C AC CT GACAGCAC AGAC C CT T 1855 

II M I II II II II I I I II M I M I I I I II I II I I II I I I I I M I M M II I I I II I I II I 

Db 1803 CTAGGG GAGGAAT GCT GGACT GGAAGCAT CT G CTT GACT CAC CT GACAGCACAGAC C CT T 18 62 

Qy 1856 T GG GGGCAGT GT C TT C CCAT AAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT TAC C 1915 

II | M I I I I I I I I I II M I I I I I II I I I I M I I I II II I I II I I I I M I I I I I I I I M I I 
Db 1863 T GGGGGCAGT GT CTT C CCAT AAT CAC CAAGACAAGAAGG GAGT GAT T C GGGAAAGT TAC C 1922 

Qy 1916 TCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTT 1975 

|| || || | II II I I I I I I II II I I M I I I I II I I II I I II II II I II II II II I I II I I M 

Db 1923 TCAAAGGCCACGACCAGCTGGTTCCCGTCACCCTCTTGGCCATTGCAGTCATCCTGGCTT 1982 

Qy 197 6 TCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCA 2 035 

M M I I I M II II II I II I I I M II I I I II I II II II I II II I I I I I I I II I I I I II I II 

Db 1983 TCGTCATGGGGGCCGTCTTCTCGGGCATCACCGTCTACTGCGTCTGTGATCATCGGCGCA 2042 

Qy 2036 AAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCA 2095 

II || I I || I I || I I I II I I I II I II II I I I I I I I II I I M M I M I I I M I II I I I I II I 

Db 204 3 AAGACGTGGCTGTGGTGCAGCGCAAGGAGAAGGAGCTCACCCACTCGCGCCGGGGCTCCA 2102 



Qy 


2096 


T GAGCAG C GT CACCAAGCT CAG CGGCCTCTTTG G GGACACT CAAT CCAAAGAC C CAAAGC 


2155 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 j 1 I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


2103 


TGAGCAGCGTCACCAAGCTCAGCGGCCTCTTTGGGGACACTCAATCCAAAGACCCAAAGC 


2162 


Qy 


2156 


CGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGG 


2215 




1 1 1 I 1 1 1 1 t 1 1 1 1 1 ! I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


2163 


CGGAGGCCATCCTCACGCCACTCATGCACAACGGCAAGCTCGCCACTCCCGGCAACACGG 


2222 


Qy 


2216 


C CAAGAT GCT CAT TAAAGC AGAC CAGC ACC AC CT GGAC CT GAC GG C C CT CC C CAC C C CAG 


2275 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 I 1 1 1 1 II 1 1 1 1 I ! 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
[ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ i • 




Db 


2223 


C CAAGAT GCT CAT T AAAG C AGAC CAGC AC CAC CT GGAC CT GAC GGCC CT CC C CAC C C CAG 


2282 


Qy 


2276 


AGT CAAC C CCAAC G CT GC AG C AGAAGC G GAAGCC C AGC C GC GGC AG C C GCGAGT GGGAGA 


2335 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 [ 1 1 1 E 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | l | | | | | 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I 




Db 


2283 


AGTCAACCCCAACGCTGCAGCAGAAGCGGAAGCCCAGCCGCGGCAGCCGCGAGTGGGAGA 


2342 


Qy 


2336 


GGAAC C AGAAC CT CAT CAAT GC CT GC ACAAAG GAC ATG C C CCC C AT GGGCTCCCCTGT GA 


2395 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 M 1 1 1 1 II 1 1 1 1 1 

I M I M 1 1 1 M II 1 1 1 1 II 1 1 1 1 II I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2343 


GGAACCAGAACCTCATCAATGCCTGCACAAAGGACATGCCCCCCATGGGCTCCCCTGTGA 


2402 


Qy 


2396 


TTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGC 


2455 




1 1 II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 I 1 1 1 I 1 1 ! 1 1 I 1 1 1 1 1 1 
I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i • i < i i > < 1 1 1 1 1 




Db 


2403 


TTCCCACGGACCTGCCCCTGCGGGCCTCCCCCAGCCACATCCCCAGCGTGGTGGTCCTGC 


2462 


Qy 


2456 


C CAT CAC G C AGC AG GGCT ACC AGCAT GAGT AC GT G GAC C AGC C CAAAAT GAG C GAGGT GG 


2515 




1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i (• i i 1 ■ ' ■ 1 ■ • ■ ■ 




Db 


2463 


C CAT CACGCAGCAGGGCT ACC AG CAT GAGT AC GT GGAC CAGC C CAAAAT GAGCGAGGTG G 


2522 


Qy 


2516 


C C CAGATGGC G CT G GAG GAC C AGGC C GC C AC ACT G GAGT AT AAGAC CAT CAAGGAACAT C 


2575 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 M 1 i 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


2523 


CCCAGATGGCGCT GGAGGACCAGGCC GCCACACT GGAGTATAAGAC CAT CAAGGAACAT C 


2582 


Qy 


2576 


T CAG CAGCAAGAGT CC CAAC CAT GGGGT GAACCT T GT GGAGAAC CT GGACAG CCT GC C C C 


2635 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ' • i i ■ ■ ■ 1 ■ 1 ■ 1 




Db 


2583 


T CAGC AGCAAGAGT C C CAAC CAT G GG GT GAACCT T GT G GAGAAC CT GGAC AGCCT GCC C C 


2642 


Qy 


2636 


CCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCG 


2695 




1 1 1 I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 
I i i i i i i i i i i i i i i i i i i i M i i i i i i i i i i i i i i i i i i i i ii i i i i i > i > • i i i i i i i 




Db 


2643 


CCAAAGTTCCACAGCGGGAGGCCTCCCTGGGTCCCCCGGGAGCCTCCCTGTCTCAGACCG 


2702 


Qy 


2696 


GTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGA 


2755 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ ■ i ■ i i i 1 * > > 1 > < ■ ■ ■ 




Db 


2703 


GTCTAAGCAAGCGGCTGGAAATGCACCACTCCTCTTCCTACGGGGTTGACTATAAGAGGA 


2762 


Qy 


2756 


GCT AC C C CAC GAACTC G CT C AC GAGAAG C CAC CAGGC C AC CACT CT CAAAAGAAACAAC A 


2815 




1 1 1 1 1 i 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i > ■ ■ ■ ■ • 1 1 ■■ ■ ■ ■ 




Db 


2763 


G CT AC CC CACGAACT C GCT CAC GAGAAGC CAC CAGGC CAC CACT CT CAAAAGAAACAACA 


2822 


Qy 


2816 


CTAACT C C T CCAAT T C CT CT C ACCT CTC CAGAAACC AGAGCT T T GG CAG GG GAGACAAC C 


2875 




I 1 1 1 I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


2823 


CTAACTCCTCCAATTCCTCTCACCTCTCCAGAAACCAGAGCTTTGGCAGGGGAGACAACC 


2882 


Qy 


2876 


CGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCC 


2935 




I I I I I I I I I I I I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2883 


CGCCGCCCGCCCCGCAGAGGGTGGACTCCATCCAGGTGCACAGCTCCCAGCCATCTGGCC 


2942 



Qy 2936 AGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGG 2 995 

I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2 943 AGGCCGTGACTGTCTCGAGGCAGCCCAGCCTCAACGCCTACAACTCACTGACAAGGTCGG 3002 

Qy 2 996 GGCTGAAGCGTACGCCCTCGCT7\AAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCC 3055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3003 GGCTGAAGCGTACGCCCTCGCTAAAGCCGGACGTACCCCCCAAACCATCCTTTGCTCCCC 3062 

Qy 3056 T T T CCACAT C CAT GAAGC C CAAT GAT GC GT GT AC A 3090 

I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3063 T TT C CAC ATC CAT GAAGC C CAAT GAT GC GT GT AC A 30 97 
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Job time : 1107.37 sees 



